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大 二 数据 结构 


e 作者 : ES 

e 字数 . 29.1 万 字 

e 大 小 : 49.00MB 

e 书号 : 978-7-3022-5565-9 
e 出版 : 2011-06-01 

e 更新 : 2015-02-16 


超级 畅销 书 《 大 话 设计 模式 》 作 者 程 杰 三 年 磨 一 剑 推出 大 话 第 二 季 ， 以 
一 个 计算 机 教师 教学 为 场景 ， 讲 解数 据 结构 和 相关 算法 的 知识 。 

《大 话 数据 结构 》 是 一 本 关于 数据 结构 和 算法 的 目 学 读物 ， 全 书 模 拟 上 
课 场景 ， 主 一 个 说 话 有 趣 的 老师 来 和 同学 们 交流 数据 结构 知识 。 它 不 板 
者 脸 洪 输 ， 它 期 望 和 读者 做 朋友 ， 在 每 每 的 会 心 一 关中， 只 是 融入 了 读 
者 脑海 ， 化 为 读者 自己 的 本 领 。 它 是 这 么 做 的 
1、 一 图 值 二 言 。 作 者 精心 设计 了 多 幅 结 构 独 特 的 图 片 ， 充 分 运用 图 形 
语言 来 体现 抽象 内 容 ， 力 求 让 读者 通过 图 形 的 直观 表达 ， 更 局 效 地 换取 
数据 结构 的 知识 。 

2、 善 于 打 比 方 。 世 界 上 很 多 道理 都 是 相通 的 。 精 心 构思 的 类 比 能 让 人 
发 出 “原来 如 此 ”的 感叹 。 读 者 会 发 现 : 枯燥 的 数据 结构 知识 背后 ， 也 隐 
藏 着 一 个 个 生活 中 的 小 故事 。 

3、 细 致 深入 ， 适 合 上 自学。 作者 对 数据 结构 涉及 到 的 一 些 经 典 算法 进行 
了 逐 行 分 析 ， 并 进行 了 多 算法 比较 。 


本 书 适合 学 过 一 门 编程 语言 的 如 下 读者 : 
“在读 的 大 中 专 计 算 机 专业 学 生 ; 

© 想 转 行 做 开发 的 非 专业 人 员 ; 

e 欲 考 计算 机 研究 生 的 应 届 或 在 职 人 员 ; 

e 工作 后 需要 补 学 或 温习 数据 结构 和 算法 的 程序 员 。 
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本 书 起 因 


大 家 好 ! 我 是 《大 话 设计 模式 》 (2008 年 初出 版 ) 的 作者 , 三 年 来 , 承 
蒙 广大 读者 的 厚爱 ，《 大 话 设计 模式 》 取 得 了 较 大 的 成 功 。 仅 在 当当 

网 ， 和 截止 本 文 写 作 时 ， 就 已 经 有 1073 次 评论 ，705 次 5 星 评价 ， 位 居 五 星 
图 书 榜 计 算 机 /网 络 类 的 累计 总 榜 第 二 名 。 此 书 已 经 成 为 国内 原创 计算 

机 类 图 书 最 畅销 的 书籍 之 一 。 











对 于 这 样 一 个 自己 襄 欢 做 、 可 以 做 得 好 ， 而 且 已 经 得 到 了 市 场 广泛 认 
可 ， 为 很 多 朋友 提供 帮助 的 事情 ， 我 没有 理由 不 去 继续 做 下 去 。 这 就 是 
我 准备 再 写 书 的 原因 。 


我 曾 做 过 调查 ， 数 据 结构 的 学 习 者 大 多 都 有 这 样 的 感慨 : 数据 结构 很 重 
要 ， 一 定 要 学 好 ， 但 数据 结构 比较 抽象 ， 有 些 算法 理解 起 来 很 困难 ， 学 
得 很 累 。 可 我 更 布 望 传 达 这 样 的 信息 : 数据 结构 非常 有 趣 ， 很 多 算法 是 
智 意 的 结晶 ， 学 习 它 是 去 感受 计算 机 编程 技术 的 魅力 ， 在 理解 掌握 它 的 
同时 ， 整 个 过 程 都 是 一 种 愉悦 的 精神 感受 ， 而 非 枯燥 乏味 的 一 门 读 程 。 
因此 我 决定 写作 一 本 关于 数据 结构 有 趣 的 书 。 














不 过 现实 总 比 理想 来 得 更 “现实 ”。 要 想 把 书写 好 ， 谈 何 容易 ， 我 需要 突 
人 破 很 多 困难 .…… 嗜 ! 不 管 如 何 ， 现 在 您 看 到 了 本 书 ， 那 就 说 明 我 已 经 克 
服 了 困难 战胜 了 上 自己 。 和 希望 您 可 以 喜欢 上 这 本 书 。 


本 书 定位 








本 书 的 定位 就 是 一 本 适合 读者 目 学 数据 络 构 的 书籍 ， 它 有 区 别 于 教材 ， 
希望 给 大 家 男 一 种 阅读 体验 。 





通常 讲解 数据 结构 的 图 书 都 是 以 教材 的 方式 呈现 。 在 写作 前 ， 我 购买 或 
在 图 书馆 借阅 了 十 几 本 非常 好 的 数据 结构 相关 教材 用 来 为 写作 本 书 做 准 
备 。 但 经 过 认真 阅读 后 ， 我 发 现 ， 它 们 大 多 不 是 一 本 好 的 “ 目 学 ?读物 。 


我 没有 轻视 这 些 好 书 的 意思 ， 不 过 教材 和 上 自学 读物 ， 所 面向 的 读者 是 完 
全 不 同 的 。 


好 的 教材 应 该 是 提纲 玫 领 、 重 点 突出 ， 一 定 要 留 出 思考 的 空间 ， 人 否则 惑 
没 必要 再 听 老 师 上 读 了 。 很 多 内 容 的 讲解 是 由 老师 在 谍 和 将 完 成， 教材 中 
有 练习 、 谍 后 习题 、 思 考题 等 ， 这 些 大 多 可 以 通过 老师 来 解答 。 比 如 我 
们 中 学 时 的 语文 、 数 学 课本 ， 很 薄 的 一 本 书 通常 要 用 一 学 期 、 甚 至 一 年 
的 时 间 来 学 习 ， 这 瓯 是 因为 它们 是 教材 而 不 是 目 学 读物 。 如 采 是 小 说 ， 
可 能 一 两 天 就 读 完 了 。 











好 的 自学 读物 的 目标 是 让 初学 者 “ 独 目 ” 全 盘 掌 握 知 识 ， 需 要 强调 " 独 
目 ” 一 词 ， 这 就 说 明 读者 在 阅读 时 ， 是 完全 依靠 目 己 的 力量 来 辐 未 知 发 
出 挑战 。 因 此 书 中 内 容 ， 要 么 不 写 ， 写 了 就 应 该 写 透 。 如 果 读 者 在 阅读 
时 总 是 疑惑 重重 ， 那 么 这 本 书 就 有 很 大 的 问题 了 。 








我 也 就 是 在 基于 这 样 的 认识 ， 决 心 将 《大 话 数 据 结构 》 真 正 写成 一 本 关 
于 数据 结构 和 算法 的 上 自学 读物 来 展开 写作 的 。 


本 书 特色 
1. 趣味 引导 


大 部 分 的 编程 类 图 书 ， 在 内 容 上 基本 都 是 直 奔 主题 。 但 是 尼采 曾 说 
过 :“ 人 们 无 法 理解 他 没有 经 历 过 的 事情 。” 换 句 话 说， 我 们 只 接受 过 去 
早已 理解 的 事物 相关 的 信息 。 这 是 一 种 比较 学 习 过 程 ， 在 这 个 过 程 中 ， 
大 脑 寻 找 每 条 信息 之 间 的 联系 。 所 以 教育 专家 普遍 认为 ， 吸 引 学 生 的 注 
意 力 ， 比 较 好 的 办 法 是 用 他 们 比较 熟知 的 知识 开始 。 





因此 在 本 书 中 ， 我 会 用 一 个 故事 、 一 个 趣味 题目 、 一 部 电影 的 介绍 等 形 
式 来 作为 每 一 章 甚 全 很 多 小 节 的 开头 ， 选 择 的 内 容 也 多 多 少 少 与 要 讲 的 
主题 内 容 相关 。 这 并 不 是 多 余 ， 而 是 有 意 为 之 。 事 实 上 ， 这 样 的 形式 在 
我 的 前 一 本 书 中 已 经 得 到 了 普遍 认可 。 











2. 図 文 井 茂 


西方 有 人 句 谚 语 ，“A picture is worth a thou-sand words. (C BRAT E) ”。 
FA_E PSSA AB HER PE, (RAT Be — ok A ERA Ee 


我 非常 认可 这 个 观点 ， 所 以 本 书 虽 没有 达到 每 一 页 都 有 图 ， 但 基本 做 到 
本 绝 大 部 分 讲解 都 有 相关 图 示 ， 关 键 算法 更 是 通过 多 图 逐步 分 解 训 析 。 
尽管 这 带 来 了 写作 上 的 难度 ， 但 却 可 以 达到 较 好 的 效果 。 毕 竞 ， 读 者 通 
过 本 书 开始 学 习 数 据 结构 时 ， 要 从 一 无 所 知 或 略 知 一 二 到 完全 理解 ， 其 
至 掌握 应 用 ， 是 需要 一 个 比较 艰 舌 的 过 程 ， 用 大 量 的 图 示 可 以 减少 这 个 
过 程 的 长 度 。 


3. 代码 详解 


我 在 写作 中 尽量 据 痉 了 传统 数据 结构 教材 的 “ 重 理论 思想 而 轻 代 码 讲 
解 ”* 的 作法 。 在 准备 数据 结构 写作 时 我 发 现 ， 很 多 教材 对 数据 结构 理论 
和 算法 设计 思想 讲 得 比较 好 ， 可 一 到 实际 代码 时 ， 有 的 把 代码 贴 出 来 加 
少量 注释 ， 有 的 直接 用 伪 代 码 形式 。 这 对 于 上 课 的 学 生还 好 ， 上 毕竟 有 老 
师 在 谍 符 中 去 详解 代码 编写 原理 ， 可 是 对 于 初学 数据 结构 和 算法 的 目 学 
者 而 言 ， 如 果 书 中 不 去 解释 代码 某 些 细节 为 什么 那样 编写 的 原因 ， 其 至 
代码 根本 不 可 能 在 茶 个 编译 右 中 运行 通过， 其 挫折 感 是 很 强烈 的 。 比 如 
eee ee ere 
es 











我 把 代码 在 运行 过 程 中 变量 的 变化 融入 到 整个 算法 设计 思想 的 讲解 中 ， 
配合 相应 的 示意 图 ， 会 帮助 大 家 更 加 容易 理解 算法 的 实质 。 这 种 讲解 模 
式 在 本 书 的 第 6、7、8、9 章 的 很 多 复杂 算法 中 有 基体 体现 ， 越 是 复杂 的 
代码 越 是 讲解 细致 。 这 算是 本 书 的 一 个 特色 ,希望 对 读者 有 帮助 。 














4. EAI 


我 把 本 书 的 内 容 虚 构成 了 一 个 老师 上 课 的 场景 ， 所 有 内 容 都 通过 这 位 老 
师表 达 出 来 ， 书 中 的 文字 非常 口语 化 ， 这 样 做 的 目的 是 为 了 更 加 直观 地 
让 读者 感觉 ， 自 己 是 在 学 习 ， 是 在 上 课 。 有 人 可 能 会 说 ， 现 在 的 课堂 大 
都 是 让 人 和 昏 昏 欲 睡 ， 把 读者 带 入 上 诬 场景 ， 不 是 更 加 让 读者 犯 团 吗 ? 我 
觉得 如 果 你 的 学 习 经 历 中 听 过 一 些 优秀 老师 的 课 ， 你 就 不 会 下 这 样 的 结 
论 。 好 的 老师 讲 读 ， 是 可 以 做 到 引人入胜 的 。 

















有 人 可 能 会 问 ， 我 为 什么 不 用 《大 话 设计 模式 》 中 的 对 话 形 式 ， 而 采用 
DAT We? 这 是 对 数据 结构 这 门 学 问 的 特点 考虑 的 。 设 计 模 式 主要 都 
古 思 想 体 现 ， 通 常会 仁者 见 仁 、 知 者 见 和 六， 用 对 话 展开 比较 容易 ， 而 数 
据 结 构 中 更 多 的 是 定义 、 术 语 、 经 典 算法 等 ， 这 些 公认 的 知识 ， 可 讨论 
的 地 方 并 不 多 ， 更 多 的 是 需要 把 它 讲 清 楚 。 让 两 个 人 在 一 起 讨论 茶 个 设 
计 模 式 的 优 缺 把， 会 非常 合适 ， 而 讨论 数据 结构 定义 的 好 坏 ， 束 没有 太 
大 意义 了 ， 不 如 让 一 个 老师 告诉 学 生 数 据 结构 的 定义 好 在 哪里 更 符合 实 
际 。 因 此 用 传统 的 讲课 形式 会 好 一 些 。 

















另外 ， 本 书 没有 习题 ， 有 思考 的 题目 也 一 定 会 给 出 某 种 答案 。 但 本 书 每 
个 复杂 知识 点 的 末尾 ， 都 会 提供 马 一 本 书 的 进一步 阅读 建议 。 这 也 是 基 
于 它 是 一 本 自学 读物 的 原则 。 读 者 阅读 本 书 可 能 是 任何 时 间 任 何 地 方 ， 
如 果 书 中 存在 没有 解答 的 习题 ， 碰 到 了 困难 是 没 法 及 时 找到 老师 来 帮助 
的 ， 因 此 本 书 尽量 避免 让 读者 有 这 样 的 困惑 存在 。 如 果 需 要 练习 的 同 

学 ， 我 觉得 还 是 应 该 考虑 再 去 买 本 习题 集 来 学 习 。 学 习 数 据 结构 和 算 

法 ， 做 题 和 上 机 写 代 码 非常 有 必要 ， 从 这 个 角度 也 说 明 ， 阅 读 完 本 书 其 
实 也 只 是 完成 入 门 而 已 。 




















本 书 既 然 是 以 老师 上 谍 的 形式 来 进行 ， 那 就 免不了 要 融入 一 名 教师 除了 
授 业 解 惑 以 外 ， 还 要 传达 一 些 个 人 价值 观 的 体现 。 书 中 很 多 细微 处 ， 如 
对 菏 位 科学 家 的 草 敬 、 对 条 个 算法 的 推 革 、 对 勤奋 励志 故事 的 讲述 等 都 
在 表达 着 一 个 老师 向 学 生 传递 真 、 善 、 美 的 意愿 。 我 始终 认为 ， 读 者 拿 
到 的 虽然 只 是 一 本 没有 表情 、 不 会 说 话 的 书 ， 但 其 实 也 是 在 隔 空 与 力 一 
个 朋友 交流 。 人 与 人 的 交流 不 可 能 只 是 就 事 论 事 ， 一 定 会 有 情感 的 沟 

通 ， 这 种 情感 如 果 能 产生 共鸣 、 达 成 互信 ， 就 会 让 事情 《比如 学 习 数据 
结构 与 算法 这 件 事 ) 本 里 更 容易 理解 和 接受 。 





























本 书 内 容 





本 书 主要 是 按照 教育 部 关于 计算 机 专业 数据 结构 读 程 大 纲 的 要 求 略微 增 
减 来 组 织 内 容 的 。 


主要 包括 : 数据 结构 介绍 ， 算 法 推导 大 O 阶 的 方法 ， 线 性 表 结构 的 介 

绍 ， 顺 序 结构 与 链 式 结构 差 寞 ， 栈 与 队列 的 应 用 ， 串 的 村 素 模 式 逻 配 、 
KMP 模 式 匹 配 算法 ， 树 结构 的 介绍 ， 二 叉 树 前 中 后 序 遍 历 ， 线 索 二 又 
树 ， 区 夫 曼 树 及 应 用 ， 图 结构 的 介绍 ， 图 的 深度 、 广 度 裔 历 ， 最 小 生成 
树 两 种 算法 ， 节 短路 径 两 种 算法 ， 拓 扑 排序 与 天 键 路 径 算 法 ， 碍 找 应 用 
的 相关 介绍 ， 折 半 查 找 、 插 值 查找 、 斐 波 那 契 查 找 等 静态 查找 ， 稠 密 索 
引 、 分 块 索 引 、 倒 排 索引 等 索引 技术 ， 二 又 排序 树 、 平 衡 二 又 树 等 动态 
查找 ，B 树 、B+ 树 技术 ， 散 列表 技术 ， 排 序 应 用 的 相关 介绍 ， 冒 泡 、 选 
ol TN TE 
法 的 対比 等 。 





本 书 读者 


数据 结构 是 计算 机 软件 相关 专业 的 基础 课程 ， 几 乎 可 以 说 ， 要 想 从 事 编 
程 工作 ， 无 论 你 是 否 是 科班 出 身 ， 都 不 可 以 绕 过 这 部 分 知识 。 因 此 ， 适 
合 阅 读本 书 的 读者 非常 广泛 ， 包 括 在 读 的 本 专科 、 中 专职 高 技校 等 计算 
机 专业 学 生 、 想 转行 做 开发 的 非 专业 人 员 、 欲 考 计 算 机 研究 生 的 应 届 或 
ie eat eee ee ne 
读者 。 





本 书 对 读者 的 技术 背景 要 求 比较 低 ， 只 要 是 学 过 一 门 高 级 编程 语言 ， 例 
如 C、C++、Java、C#、VB 等 束 可 以 开始 阅读 本 书 。 不 过 由 于 当中 涉及 
到 比较 复杂 的 算法 知识 ， 需 要 读者 有 一 定 的 数学 修养 和 你 辑 思 维 能 力 ， 
否则 可 能 书籍 的 后 半 部 分 阅读 起 来 会 比较 吃力 。 


本 书 研 读 方法 


事实 上 ， 任 何 有 难度 的 知识 和 技巧 ， 都 不 是 那么 容易 被 掌握 的 。 我 义 管 
己 经 组 痢 通 俗 易 懂 的 方 癌 努力 ， 可 有 些 数据 结构 ， 特 别 是 经 典 算 法 ， 是 
儿 代 科学 家 的 智 存 结晶 ， 因 此 要 和 掌握 它们 还 是 需要 读者 的 全 力 投入 。 











美国 畅销 书 《 如 何 阅 读 一 本 书 》 中 提 到 “阅读 可 以 是 一 件 主动 的 事 ， 阅 
读 越 主动 ， 效 果 越 好 。 拿 同样 的 书 给 背景 相近 的 两 个 人 阅读 ， 一 个 人 却 
比 另 一 个 人 从 书 中 得 到 了 更 多 ， 这 是 因为 ， 首 先 在 于 这 人 的 主动 ， 其 

次 ， 在 于 他 在 阅读 中 的 每 一 种 活动 都 参与 了 更 多 的 技巧 。 这 两 件 事 是 奶 
恩 相 关 的 。 阅 读 是 一 个 复杂 的 活动 ， 就 跟 写 作 一 样 ， 包 含 了 大 量 不 同 的 
活动 。 要 达成 民 好 的 阅读 ， 这 些 活动 都 是 不 可 或 缺 的 。 一 个 人 越 能 展 好 
运作 这 些 活动 ， 阅 读 的 效果 也 就 越 好 。” 








我 当然 希望 读者 在 阅读 本 书后 收获 巨大 ， 但 这 显然 是 一 亲情 愿 。 要 想 获 
得 更 多 ， 您 可 能 也 需要 付出 类 似 我 写作 一 样 的 力气 来 阅读 ， 例 如 摘抄 文 
字 、 眉 批 心得 、 入 纸 演算 、 代 码 输入 电脑 ， 以 及 您 自己 在 编程 工作 中 的 
运用 等 。 这 些 相应 活动 的 执行 ， 将 会 使 您 得 到 巨大 的 收获 。 








作为 作者 ， 建 议 本 书 的 研读 方法 为 : 


。 复习 C 语 言 的 基础 知识 。 如 果 你 掌握 的 是 别 的 语言 也 人 不要紧 ， 适 当 
了 解 一 些 C 语 言 和 你 掌握 的 编程 语言 的 语法 差异 还 是 有 必要 的 。 其 
至 将 本 书 代码 改造 成 为 一 种 语言 本 里 束 是 一 种 非常 好 的 学 习 方 法 。 

。 阅读 第 一 过 时 ， 建 议 从 头 至 尾 进行 。 如 果 你 对 前 面 的 知识 有 足够 了 
解 ， 当 然 可 以 跳 过 直接 阅读 后 面 的 章节 。 不 过 重要 学 习 一 门 完整 的 
知识 并 形成 体系 。 通 读本 书 ， 还 是 最 好 的 学 习 方 法 。 

。 阅读 时 ， 摘 抄 是 非常 好 的 习惯 。“ 最 汉 的 墨水 也 胜 于 最 强 的 记 
忆 ! ”有 不 少 读者 会 认为 摘抄 了 将 来 也 不 会 再 去 看 ， 有 什么 必要 ， 
但 其 实在 写字 的 过 程 就 是 大 脑 学 习 的 过 程 ， 写 字 在 减缓 你 阅读 的 速 
度 ， 从 而 让 你 更 好 地 消化 阅读 的 内 容 。 相 信 大 家 都 能 理解 , “ 轿 轿 

















否 训 ”和 “ 慢 慢 品味 ”的 差异 ， 学 习 同 样 如 此 。 
。 阅读 每 一 章 时 ， 特 别 是 在 阅读 算法 的 推导 过 程 时 ， 一 定 要 在 电脑 中 
运行 代码 (本 书 源码 的 下 载 地 址 可 以 到 http://cj723.cnblogs.com 中 的 











《大 话 数 据 结 构 相 关 主 题 》 中 找到 )〉 ， 了 解 代码 的 运行 过 程 。 本 书 的 很 
多 算法 都 做 到 了 逐 行 讲解 ， 但 单纯 阅读 可 和 & 真 的 很 难 达 到 理解 的 程度 

(这 是 纸 质 书 无 法 克服 的 缺陷 ) ， 需 要 你 通过 开发 工具 调试 ， 并 设置 断 
点 和 运行 执 行 ， 并 参照 书 中 的 讲解 观察 变量 的 变化 情况 来 理解 算法 的 
编写 原理 。 








。 阅读 完 每 一 章 时 ， 一 定 要 在 理解 基础 上 记忆 一 些 关 键 东 西 。 最 佳 的 
效果 就 是 你 可 以 不 看 书 也 做 到 一 点 不 错 地 默写 出 相关 算法 。 
阅读 完 每 一 章 时 ， 一 定 要 适当 练习 。 本 书 没有 提供 练习 题 ， 但 市 场 
上 相关 的 数据 结构 习题 集 比比 皆 是 ， 可 以 选择 尝试 。 另 外 互联 网 上 
也 可 以 获得 足够 的 习题 来 给 你 练习 。 练 习 的 目的 是 为 了 检测 自己 是 
否 真 的 完全 理解 了 书 中 的 内 容 。 事 实 上 很 多 时 候 ， 阅 读 中 的 人 们 只 
是 自我 感觉 理解 ， 而 并 非 真 正 的 明白 。 

学 习 不 可 能 一 践 而 束 ， 数 据 结构 和 算法 如 果 通 过 一 hn 
握 ， 那 本 身 就 是 笑话 。 本 书 附录 提供 了 本 书写 作 时 的 参考 书目 ， 

本 都 是 最 优秀 的 数据 结构 或 相关 的 中 文书 籍 各 有 侧重 ， J 
以 适当 地 阅读 。 














例如 C90 祭 准 的 注释 要 求 后/ 注释 文学 PM AS IOV EEE: 要 求 
变量 声明 必须 要 在 函数 的 最 前 面 ， 只 能 是 “int iiforG=0:i<ni++).……. 
而 不 允许 如 ‘for(int iji=0;i<n;i++)” 这 样 的 方式 : 再 比如 C++ 中 函数 的 参数 
可 以 传递 如 “void CreateBiTree(BiTree &T)” 的 地 址 变量 ， 但 在 C 语 言 中 ， 
只 能 传递 如 “void CreateBi-Tree(BiTree 7T)” 的 指针 变量 。 因 此 当 你 看 到 书 
中 的 有 些 代 码 到 处 都 是 “%* 时 ， 就 用 不 着 奇怪 了 。 














出 于 为 了 让 代码 可 以 在 低 端 编译 环境 通过 的 考虑 ， 牺 牲 一 些 代 码 的 简捷 
eee 奈何 和 必要 的 。 最 终 我 将 书 中 全 部 代码 都 改 成 C90 
示 准 的 代码 


C 语 言 初 学 者 可 能 会 因为 刚 接触 编程 语言 ， 特 别 是 对 指针 的 理解 不 深 ， 
而 担心 阅读 困难 。 我 个 人 感觉 ， 单 纯 学 习 指 针 是 很 难 理解 它 的 真正 用 途 
和 好 处 ， 而 通过 学 习 数 据 结构 ， 特 别 是 像 链 式 存储 结构 在 各 种 结构 算法 
中 的 运用 ， 反 而 可 以 让 读者 进一步 的 理解 指针 的 优越 之 处 。 从 这 个 角度 
数据 结构 的 学 习 可 以 反 过 来 加 强 读者 对 C 语 言 ， 特 别 是 指针 概念 的 
理解 。 











REA S Ae Ft 


C 语 言 是 一 门 古 老 的 高 级 语言 ， 它 的 应 用 范围 非常 广泛 ， 因 此 我 选择 它 
作为 本 书 的 算法 展示 语言 。 如 傈 该 者 之 前 学 过 它 ， 那 么 阅读 本 书 就 不 存 
在 语言 障碍 。 异 得 C++ 语 言 的 读者 ， 同 样 也 不 会 有 任何 语言 上 的 问题 。 


掌握 Java、C#、VB 等 面向 对 象 语言 的 读者 ， 当 面 对 书 中 大 量 的 C 语 言 式 
的 结构 〈struct) 声明 和 针对 结构 的 参数 传递 的 代码 时 ， 可 以 理解 为 是 
类 的 定义 和 由 类 生成 对 象 的 传递 。 尺 管 的 确 存在 差异 ， 但 并 不 影响 整体 
对 数据 结构 知识 和 算法 原理 的 理解 。 


我 个 人 感觉 ， 哪 怕 是 对 C 语 言 不 熟悉， 也 不 妨 利 用 学 习 数 据 结构 的 机 
会 ， 学 习 一 下 C 语 言 的 编程 方法 ， 这 对 于 将 来 应 用 其 他 高 级 语言 也 是 有 
很 大 帮助 的 。 


不 是 一 个 人 在 战斗 





首先 要 感谢 我 的 妻子 李 秀 芳 对 我 写作 本 书 期 间 的 全 力 文 持 ， 我 辞职 写 

作 ， 没 有 她 精神 上 的 理解 或 励 和 生活 上 的 悉心 照顾 ， 是 不 可 能 走出 这 一 
步 并 顺利 完成 书稿 的 。 我 们 的 儿子 程 晟 涵 如 今 已 经 三 周岁 ， 我 是 在 他 每 
日 的 欢声 笑语 和 闫 哄 暗暗 中 进行 每 一 章节 的 构思 和 写作 ， 和 希望 他 可 以 菠 
壮 成 长 。 我 的 父母 已 经 年 近 ， 他 们 为 我 的 全 职 创作 也 其 为 担心 和 忧虑 ， 
这 里 也 要 说 一 声 抱歉 。 














写作 过 程 中 ， 本 人 购买 和 借阅 了 与 数据 结构 相关 的 大 量 书籍 ， 详 细 书 目 
见 附录 。 没 有 前 替 的 贡献 ， 惑 没有 本 书 的 出 版 ， 也 希望 本 书 能 成 为 这 些 
书籍 的 前 期 读物 。 在 此 问 这 些 图 书 作 者 表示 衷心 的 感谢 。 


仅 有 作者 是 不 可 能 完成 图 书 的 出 版 的 ， 本 人 要 非 第 感谢 清华 大 学 出 版 社 
的 朋友 们 ， 他 们 是 本 书 的 最 初 读者 ， 也 是 协助 本 人 将 此 书 由 毛 粮 变 精 展 
的 最 有 力 帮 手 。 本 书 的 封面 设计 程 瑜 、 插 图 设计 周 翔 ， 都 是 在 反 反 复 复 
的 修改 中 完成 创作 的 。 写 作 中 还 得 到 了 周 移 、 户 加 翔 、 张 伸 、 关 文 佳 、 
Milo、 陈 钢 、 刘 超 、 刘 唯一 、 杨 绣 国 、 邱 妩 婷 、 雷 顺 、 杨 诗 熏 、 高 宇 

翔 、 林 健 的 友情 帮助 ， 他 们 都 在 本 人 的 创作 中 提出 了 宝贵 建议 。 





在 此 回 所 有 帮助 与 文 持 我 的 朋友 道 一 声 : 谢谢 ! 


程 杰 


编者 有 的 话 


2007 年 ， 一 本 特 立 独行 的 IT 技术 图 书 《 大 话 设计 模式 》 横 空 出 世 ， 开 创 
了 一 种 新 派 技术 图 书 风 格 。 当 年 以 及 后 来 的 数 年 间 ， 横 扫 各 大 排行 ， 目 
前 销售 已 经 超过 5 万 册 ， 几 乎 是 纯粹 的 店 销 销量 ， 在 最 近 10 年 的 开 图 书 
市 场 中 ， 这 是 个 了 不 起 的 数据 。 


作者 程 杰 并 没有 满足 这 个 成 绩 ， 耗 时 3 年 潜心 创作 了 另外 一 本 同样 是 程 
序 员 基 础 的 著作 一 一 《大 话 数 据 结构 》。 








次 实话 ， 作 为 策划 ， 我 并 没有 过 多 干预 作者 的 创作 过 程 ， 仅 仅 是 在 细节 
上 提出 我 的 一 些 看 法 。 我 的 工作 更 多 的 是 与 作者 来 回 推 敬 成 稿 后 的 一 些 
说 法 或 者 技术 点 上 的 问题 ， 男 外 还 反复 探讨 了 书 中 的 类 比 案 例 的 可 理解 
性 。 最 终 细 市 融 定 还 是 在 上 海 一 家 咖啡 馆 里 完成 的 ， 我 和 作者 在 那里 折 
腾 了 一 下 午 ， 终 于 达成 共识 。 











数据 结构 在 茶 种 程度 上 和 设计 模式 类 似 ， 都 是 前 替 的 武功 套路 。 不 同 的 
re, Weibel LAE BEY IN Seine, Mn BaZa Me LA 
上 千年 的 元 数 科学 家 、 数 学 家 的 智 惹 況 淀 , 更 加 具有 深 厚 的 背景 。 


























大 家 知道 ， 程 序 是 利用 计算 机 高 速 运算 能 力 来 协助 我 们 处 理 一 些 需 要 海 
量 运 算得 出 结果 的 问题 ， 应 用 程序 花哨 的 界面 和 有 效 的 用 户 体 验 ， 归 根 
到 属 都 需要 在 后 台 看 不 见 的 地 方 进行 运算 ， 得 出 我 们 需要 的 结 无 
论 是 在 气象 预报 还 是 “极品 飞车 ”。 











一 台 计 算 机 的 CPU 运 算 能 力 是 固定 的 ， 只 会 机 械 地 接受 程序 的 指令 ， 所 
以 ， 算 法 的 优 务 就 决定 了 程序 设计 水 平 的 蜗 低 。 举 个 简 蛙 的 例子 ， 数 据 
库 性 能 优化 这 个 工作 ， 收 费 是 按照 小 时 来 计算 的 ， 水 平 高 的 每 小 时 可 以 
达到 30 万 美金 ， 为 什么 会 值 这 么 多 钱 ? 有 价值 吗 ? 这 其 实 就 是 算法 的 力 
量 ， 使 用 优秀 的 算法 可 以 为 大 型 企业 市 省 海量 的 硬件 投入 同时 带 来 巨大 
的 效率 提升 一 一 比如 之 前 需要 100 台 小 型 机 ， 优 化 之 后 只 需要 10 台 就 够 
T; 之 前 碍 询 一 个 数据 需要 一 分 钟 出 来 结 末 ， 优 化 之 后 1 秒 钟 就 够 








本 .……. 这 些 对 于 企业 来 说 ， 节 省 的 成 本 可 就 远 远 不 止 投入 的 几 十 上 百 万 
的 优化 费用 了 。 


国内 外 优秀 的 程序 员 很 多 毕业 于 数学 专业 ， 也 在 一 定 程度 上 说 明了 这 个 
问题 。 国 内 的 程序 开发 现状 跟 国 外 略 有 不 同 ， 大 家 都 在 关注 界面 和 用 户 
体验 ， 在 算法 上 往往 要 求 不 高 。 这 其 实 是 国内 软件 行业 与 国外 软件 行业 
的 最 大 差距 所 在 。 








我 们 的 程序 员 因 为 在 受 教育 的 过 程 中 《大 都 是 在 大 学 ) ， 由 于 种 种 原 
因 ， 数 据 结构 和 算法 的 基本 功 通 党 要 差 一 些 ， 等 从 业 以 后 想 再 补课 义 缺 
之 好 的 ” ”教材 ， 或 者 说 适合 自学 的 教材 。 数 据 结构 不 是 说 没有 优秀 教 
材 ， 比 如 《数据 结构 》《 算 法 导论 》 这 样 的 经 典 著作 我 们 绝对 不 能 说 不 
好 ， 但 是 作为 自学 ， 实 在 是 有 点 难 嘴 。《 大 话 数 据 结构 》 延 续 了 作者 一 
员 的 轻松 调侃 的 风格 ， 采 用 了 师 生 对 话 的 方式 ， 展 开 讨 论 ， 其 中 穿插 了 
大 量 “ 庸 俗 ” 的 类 比 案例 ， 帮 助 大 家 迅速 < 开 穷 ”。 








在 我 的 一 篇 博文 Ckobeluan.blog.51cto.com/237742/212175) 中 淡色 国内 
原创 技术 书 整 体 层 次 偏 低 ， 不 是 因为 国内 没有 高 手 ， 最 关键 的 原因 有 两 
条 : 第 一 ， 国 内 版 税 太 低 ， 与 高 手 作 者 的 收入 差别 太 大 ， 导 致 很 多 人 没 
有 时 间 和 心气 来 写 书 ; 第 二 ， 国 内 知识 产权 保护 不 力 ， 出 版 社 无 法 用 提 
高 定价 的 方式 来 为 读者 和 作者 提供 更 好 的 服务 。 








类 似 程 杰 这 样 的 作者 ， 真 诚 地 将 自己 的 感悟 奉献 出 来 ， 与 作者 的 用 心 相 
比 ， 作 为 朱 划 编辑 付出 的 劳动 残 不 值得 一 提 了 。 这 里 真心 希望 读者 可 以 
从 书 中 找到 需要 的 东西 ， 也 希望 国内 更 多 咒 人 涌现 出 来 ， 为 大 家 创作 更 
适合 中 国人 阅读 的 优秀 拉 术 图 书 。 清 华 大 学 出 版 社 ” 栾 大 成 局 示 数 据 结 
构 : 是 相互 之 间 存 在 一 种 或 多 种 特定 关系 的 数据 元 系 的 集合 。 











第 1 章 数据 结构 绪论 


启示 


数据 结构 : 
是 相互 之 间 存 在 一 种 或 多 种 特定 关系 的 数据 元 素 的 集合 。 





1.1 开场 白 


If you give someone a program, you willfrustrate them for a day; if you teach 
themhow to program, you will frustrate them fora lifetime. (如 果 你 交 给 某 
人 一 个 程序 ， 你 将 折磨 他 一 整 天 ， 如 果 你 教 菜 人 如 何 编写 程序 ， 你 将 折 
磨 他 一 辈子 。) 


而 我 可 能 就 是 要 折磨 你 们 一 埋 子 的 那个 人 。 大 家 好 ! 我 是 《数据 结构 》 
XRK, RWA. AA PEURA”, R MAE 
EA EVAR ES fos IR o 


在 座 的 大 家 给 我 面子 ， 郑 来 选修 我 的 读 ， 这 点 我 很 高 兴 。 不 过 在 上 谍 
前 ， 有 些 话 还 是 要 先 说 一 下 。 


数据 结构 是 计算 机 专业 的 基础 课程 ， 但 也 是 一 门 不 太 容 易学 好 的 课 ， 它 
当中 有 很 多 费 脑子 的 东西 ， 之 后 在 上 课时 ， 你 知 碰 到 了 困惑 或 不 解 的 地 
方 ， 都 是 很 正常 的 反应 ， 就 像 你 想 乘 发 机 去 旅行 ， 在 飞机 场 晚点 几 个 钟 
k, 上 了 Wa ate SIE, AAT PE, 都 入 平常 , 具 要 
能 安全 到 达 就 是 成 功 。 

















如 末 你 的 学 习 目 的 是 为 了 将 来 要 做 一 个 优秀 的 程序 员 ， 回 微软 、Google 
的 工程 师 们 看 齐 ， 那 么 你 应 该 要 努力 学 好 它 ， 不 单 是 来 听 谍 、 看 看 教科 
书 ， 还 需要 课 后 做 题 和 上 机 练习 。 不 过 话说 回来 ， 如 果 你 真有 这 样 的 志 
RA EE 








如 果 你 的 目的 是 为 了 考 计 算 机 、 软 件 方 面 的 研究 生 ， 那 么 这 门 必 考 谍 ， 
你 现在 就 可 以 准备 起 来 一 一 很 多 时 候 ， 考 研 玩 的 不 是 智商 ， 其 实 就 是 一 
个 人 投入 的 时 间 而 已 。 





如 果 你 只 是 为 了 混 个 学 分 ， 那 么 你 至 少 应 该 要 坚持 来 上 课 ， 在 我 的 课 泽 





上 听 懂 了 ， 学 明白 了 ， 考 前 适当 地 复习 ， 拿 下 这 几 个 学 分 应 该 不 在 话 


GARR ERT) eH, 当然 也 可 以 , RIAA DS TT eT, BRE 
RN 
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如 果 ， 我 是 说 真 的 如 果 ， 你 是 一 个 对 编程 无 比 爱 好 的 人 ， 你 学 数据 结构 
的 目的 ， 既 不 是 为 了 工作 为 了 钱 ， 也 不 是 为 了 学 位 和 考试 ， 而 只 是 为 了 
更 好 地 去 感受 编程 之 美 。 啊 ， 你 应 该 得 到 我 的 欣赏 ， 我 想 我 非常 愿意 与 
你 成 为 朋友 一 一 因为 我 自己 也 没有 做 到 如 此 纯粹 地 去 学 习 和 应 用 它 。 





1.2 ”你 数据 结构 怎么 学 的 ? 


早先 我 有 一 个 学 生 叫 蔡 膛 ， 绰 号 “小 菜 ”"。 他 前 段 时 间 一 直通 过 E-mail 与 
我 交流 ， 其 中 说 起 了 他 工作 的 一 些 经 历 ， 感 慨 万 干 。 我 在 这 里 就 讲 讲 小 


SKA BF o 





ME VEER, 在 働 我 学生 時 , SESE AS ICUS UF ESM, INR, 
考试 也 是 临时 突击 后 勉强 及 格 。 毕 业 后 ， 他 几经 求职 ， 算 是 找到 了 一 份 
程序 员 的 工作 。 


工作 中 ， 有 一 次 他 们 需要 开发 一 个 客服 电话 系统 ， 他 们 项 目 经 理 安排 小 
荣 完 成 客户 排队 模块 的 代码 工作 。 





小 且 觉 得 这 个 很 容易 ， 用 数据 库 设计 了 一 张 客户 排队 表 ， 并 且 用 一 个 日 
动 递增 的 整 型 数字 作为 客户 的 编号 。 只 要 来 一 个 客户 ， 就 给 这 张 表 的 末 
尾 插入 一 条 数据 。 等 客服 系统 一 有 空间 ， 就 从 这 张 表 中 取出 最 小 编号 的 
客户 提交 ， 并 且 删 除 这 条 记录 。 花 了 两 天 时 间 ， 他 完成 开发 并 测试 通过 
后 ， 得 意 地 提交 了 代码 。 谁 知 他 们 的 项 目 经 理 ， 看 完 代 码 后 ， 跑 到 他 的 
桌 前 ， 拍 着 桌子 对 他 说 :“ 你 数据 结构 怎么 学 的 ? 这 种 实时 的 排队 模 
块 ， 用 什么 数据 库 呀 ， 在 内 存 中 完成 不 就 行 了 吗 。 赶 快 改 ， 今 天 一 定 要 
完成 ， 明 天 一 早 交 给 我 。” 























小 亲 吓 得 一 身 冷 汗 ， 这 脸 丢 得 有 些 大 了 ， 上 自己 试用 期 都 没 结束 ， 别 因此 
失去 工作 。 于 是 他 当天 加 班 加 点 ， 和 忙 到 晚上 十 一 点 ， 用 数组 变量 重新 实 
i Ee eee 
数组 的 长 度 。 





回 到 家 中 ， 他 害怕 这 个 代码 有 问题 ， 于 是 就 和 他 的 表 哥 大 乌 说 起 了 这 个 
事 。 他 表 哥 笑星 喀 地 对 他 说 :“ 你 数据 结构 怎么 学 的 ? DS TH KAS 
大 口 ， 一 句 话 也 说 不 出 来 。 然 后 他 表 哥 告诉 他 ， 这 种 实时 的 排队 系统 ， 
通常 用 数据 结构 中 的 “队列 结构 ”是 比较 好 的 ， 用 数组 虽然 也 可 以 ， 但 是 
又 要 考虑 洪 出 ， 又 要 考 碟 新 增 和 删除 后 的 数据 移动 ， 总 的 说 来 很 不 方 








便 。 你 只 要 这 样 .……. 这 样 .…… 就 可 以 了 。 


小 菜 在 大 乌 的 帮助 下 ， 人 忙 到 凌晨 3 点 ， 重 新 用 队列 结构 又 写 了 一 这 代 
码 ， 上 班 时 用 U 盘 找 回 公司 ， 终 于 算是 过 了 项 目 经 理 这 一 天。 





之 后 ， 小 染 开 始 重视 数据 结构 ， 找 回 大 学 的 读本 重新 学 习 。 他 还 给 我 有 
了 好 些 邮 件 ， 问 了 我 不 少 他 困惑 的 数据 结构 和 算法 的 问题 ， 我 也 一 一 给 
了 他 解答 。 终 于 有 一 天 ， 他 学 完了 整个 课程 的 内 容 ， 并 给 我 写 了 一 封 感 
谢 信 ， 信 中 是 这 么 说 的 :“ 封 老师 :您 好 ! 感谢 您 这 段 时 间 的 帮助 ， 在 
大 学 时 没有 好 好 上 您 的 课 真 是 我 最 大 的 遗憾 。 我 现在 已 经 学 完了 《数据 
结构 》 整 本 书 的 内 容 ， 收 获 还 是 很 大 的 。 可 是 我 一 直 有 这 样 的 困惑 想 请 
教 您 ， 那 就 是 我 在 工作 中 发 现 ， 我 所 需要 的 如 栈 、 队 列 、 链 表 、 散 列表 
等 结构 ， 以 及 奉 找 、 排 序 等 算法 ， 在 编程 语言 的 开发 工具 包 中 都 有 完美 
的 实现 ， 我 只 需要 掌握 如 何 使 用 它们 就 可 以 了 ， 为 什么 还 要 去 弄 慌 这 里 
面 的 算法 原理 呢 ?” 

















我 收 到 这 封 信 时 ， 立 马路 了 起 来 ， 马 上 拨 通 了 他 的 手机 ， 第 一 句 话 就 
征 .…… 你 们 猜 猜 看 ， 我 说 了 啥 ?“ 你 数据 结构 怎么 学 的 ? ”( 全 场 同学 齐 
AMG KR) 





好 了 ， 我 为 什么 这 么 讲 ， 等 你 们 学 完 我 的 课程 就 自然 会 明白 。 我 只 希望 
在 将 来 ， 不 要 用 个 人 也 对 你 们 说 出 这 人 句 话 ， 如 果 妆 真 昕 到 了 这 人 句 话 ， 
就 拜托 你 不 要 说 你 的 数据 结构 老师 是 我 封 清 扬 ， 嘿 嘿 。 








现在 我 们 正式 开始 上 谍 。 


1.3 ”数据 结构 起 源 








早期 人 们 都 把 计算 机 理解 为 数值 计算 工具 ， 就 是 感觉 计算 机 当然 是 用 来 
计算 的 ， 所 以 计算 机 解决 问题 ， 应 该 是 先 从 具体 问题 中 抽象 出 一 个 适当 
Do S i ee ie ges 
一 个 实际 的 软件 。 


可 现实 中 ， 我 们 更 多 的 不 是 解决 数值 计算 的 问题 ， 而 是 需要 一 些 更 科学 
有 效 的 手段 《比如 表 、 树 和 图 等 数据 结构 ) 的 帮助 ， 才 能 更 好 地 处 理 问 
题 。 所 以 数据 结构 是 一 门 研究 非 数 值 计算 的 程序 设计 问题 中 的 操作 对 
象 ， 以 及 它们 之 间 的 关系 和 操作 等 相关 问题 的 学 科 。 


1968 年 ， 美 国 的 高 德 纳 (Donald E. Knuth) 教授 在 其 所 写 的 《计算 机 程 
序 设计 艺术 》 第 一 卷 《基本 算法 》 中 ， 较 系统 地 阐述 了 数据 的 逻辑 结构 
和 存储 结构 及 其 操作 ， 开 创 了 数据 结构 的 课程 体系 。 同 年 ， 数 据 结构 作 
为 一 门 独立 的 课程 ， 在 计算 机 科学 的 学 位 课程 中 开始 出 现 。 也 就 是 说 ， 
那 之 后 计算 机 相关 专业 的 学 生 开始 接受 《数据 结构 》 的 “折磨 "一 一 其 实 


应 该 是 享受 才 对 。 











之 后 ，70 年 代 初 ， 出 现 了 大 型 程序 ， 软 件 也 开始 相对 独立 ， 结 构 程序 设 
计 成 为 程序 设计 方法 学 的 主要 内 容 ， 人 们 越 来 越 重视 “数据 结构 ?， 认 为 
程序 设计 的 实质 是 对 确定 的 问题 选择 一 种 好 的 结构 ， 加 上 设计 一 种 好 的 
算法 。 可 见 ， 数 据 结 构 在 程序 设计 当中 占据 了 重要 的 地 位 。 程 序 设计 = 
数据 结构 + 算法 








1.4 基本 概念 和 术语 


说 到 数据 结构 是 什么 ， 我 们 得 先 来 谈 谈 什么 叫 数据 。 





正 所 谓 “ 巧 妇 难 为 无 米 之 炊 ”， 再 强大 的 计算 机 ， 也 是 要 有 ”" 米 "下 锅 才 可 
以 干 活 的 ， 否 则 就 是 一 堆 破 铜 烂 铁 。 这 个 “ 米 ” 就 是 数据 。 


1.4.1 数据 


数 据 : 是 描述 客观 事物 的 符号 ， 是 计算 机 中 可 以 操作 的 对 象 ， 是 能 被 计 
算 机 识别 ， 并 输入 给 计算 机 处 理 的 符号 集合 。 数 据 不 仅仅 包括 整 型 、 实 
型 等 数值 类 型 ， 还 包括 字符 及 声音 、 图 像 、 视 频 等 非 数 值 类 型 。 





比如 我 们 现在 常用 的 搜索 引擎 ， 一 般 会 有 网 页 、MP3、 图 片 、 视 频 等 分 
类 。MP3 就 是 声 首 数据 ， 图 片 当然 是 图 像 数 据 ， 视 频 残 不 用 说 了， 而 网 
页 其 实 指 的 就 是 全 部 数据 的 集合 ， 包 括 最 重要 的 数字 和 字符 等 文字 数 
据 。 











也 惑 是 说 ， 我 们 这 里 次 的 数据 ， 其 实 就 是 符号 ， 而 且 这 些 符 号 必须 具备 
两 个 前 提 : 


。 可 以 输入 到 计算 机 中 。 
o 能 被 计算 机 程序 处 理 。 


对 于 整 型 、 实 型 等 数值 类 型 ， 可 以 进行 数值 计算 。 





对 于 字符 数据 类 型 ， 束 需要 进行 非 数 值 的 处 理 。 而 声 首 、 图 像 、 视 频 等 
其 实 是 可 以 通过 编码 的 手段 变 成 字符 数据 来 处 理 的 。 


1.4.2 ”数据 元 素 





数据 元 素 : 是 组 成 数据 的 、 有 一 定 意义 的 基本 单位 ， 在 计算 机 中 通常 作 
为 整体 处 理 。 也 被 称 为 记录 。 





比如 ， 在 人 类 中 ， 什 么 是 数据 元 系 呀 ? 当然 是 人 了 。 


T PE E E 





1.4.3 ”数据 项 


数据 项 : 一 个 数据 元 素 可 以 由 名 干 个 数据 项 组 成 。 





比如 和 人 这样 的 数据 元 素 ， 可 以 有 眼 、 耳 、 鼻 、 嘴 、 手 、 脚 这些 数 据 项 ， 
也 可 以 有 姓名 、 年 龄 、 性 别 、 出 生地 址 、 联 系 电话 等 数据 项 ， 有 具体 有 哪 
些 数据 项 ， 要 视 你 做 的 系统 来 决定 。 








数据 项 是 数据 不 可 分 割 的 最 小 单位 。 在 数据 结构 这 门 课程 中 ， 我 们 把 数 
据 项 定义 为 最 小 单位 ， 是 有 助 于 我 们 更 好 地 解决 问题 。 所 以 ， 记 住 了 ， 
数据 项 是 数据 的 最 小 单位 。 但 真正 讨论 问题 时 ， 数 据 元 素 才 是 数据 结构 
中 建 并 数据 模型 的 着 眼 点 。 束 像 我 们 讨论 一 部 电影 时 ， 是 讨论 这 部 电影 
角色 这 样 的 “数据 元 素 *”， 而 不 是 针对 这 个 角色 的 姓名 或 者 年 龄 这 样 

的 “数据 项 ”去 研究 分 析 。 




















1.4.4 数据 对 象 


BUENA: 是 性 质 相 同 的 数据 元 素 的 集合 ， 是 数据 的 子 集 。 


什么 叫 性 质 相 同 呢 ， 是 指数 据 元 素 具 有 相同 数量 和 类 型 的 数据 项 ， 比 


如 ， 还 是 刚才 的 例子 ， 人 都 有 姓名 、 生 日 、 性 别 等 相同 的 数据 项 。 








既然 数据 对 象 是 数据 的 子 集 ， 在 实际 应 用 中 ， 处 理 的 数据 元 素 通 常 具有 
相同 性 质 ， 在 不 产生 混 消 的 情况 下 ， 我 们 都 将 数据 对 象 简称 为 数据 。 





好 了 ， 有 了 这 些 概念 的 铺垫 ， 我 们 的 主角 登场 了 。 


说 了 数据 的 定义 ， 那 么 数据 结构 中 的 结构 又 是 什么 呢 ? 


1.4.5 ”数据 结构 


结构 ， 简 单 的 理解 束 是 关系 ， 比 如 分 子 结构 ， 就 是 说 组 成 分 子 的 原子 之 
间 的 排列 方式 。 严 格 点 说 ， 结 构 古 指 各 个 组 成 部 分 相互 搭配 和 排列 的 方 
式 。 在 现实 世界 中 ， 不 同 数 据 元 系 之 间 不 是 独立 的 ， 而 是 存在 特定 的 关 
系 ， 我 们 将 这 些 关 系 称 为 结构 。 那 数据 结构 是 什么 ? 数据 结构 : 是 相互 
之 间 存 在 一 种 或 多 种 特定 关系 的 数据 元 系 的 集合 。 








在 计算 机 中 ， 数 据 元 素 并 不 是 孤立 、 杂 乱 无 序 的 ， 而 是 具有 内 在 联系 的 
OO 
织 形式 。 





为 编写 出 一 个 “好 ”的 程序 ， 必 须 分 析 符 处 理 对 象 的 特性 及 各 处 理 对 象 之 
间 存 在 的 关系 。 这 也 就 是 研究 数据 结构 的 意义 所 在 。 





定义 中 提 到 了 一 种 或 多 种 特定 关系 ， 具 体 是 什么 样 的 关系 ， 这 正 是 我 们 
下 和 面 要 讨论 的 问题 。 


1.5 逻辑 结构 与 物理 结构 
按照 视点 的 不 同 ， 我 们 把 数据 结构 分 为 逻辑 结构 和 物理 结构 。 


15.1 逻辑 结构 





逻辑 结构 : 是 指数 据 对 象 中 数据 元 系 之 间 的 相互 和 关系。 其 实 这 也 是 我 们 
今后 最 需要 关注 的 问题 。 逻 辑 结 构 分 为 以 下 四 种 : 





1. 集合 结构 





集合 结构 : 集合 结构 中 的 数据 元 素 除 了 同属 于 一 个 集合 外 ， 它 们 之 间 没 
有 其 他 关系 。 各 个 数据 元 素 是 “平等 *? 的 ， 它 们 的 共同 属性 是 “同属 于 一 
个 集合 "”。 数 据 结 构 中 的 集合 关系 就 类 似 于 数学 中 的 集合 〈 如 网 1-5-1 所 
ZR) 








2. 线性 结构 








线性 结构 :线性 结构 中 的 数据 元 系 之 间 是 一 对 一 的 关系 (如 图 1-5-2 所 
AN) 。 


图 1-5-2 


3. 树 形 结构 





树 形 结构 : 树 形 结构 中 的 数据 元 素 之 间 存 在 一 种 一 对 多 的 层次 关系 〈 如 
图 1-5-3 所 示 ) 。 


图 1-5-3 


4. 图 形 结构 





图 形 结构 ， 图 形 结构 的 数据 元 系 是 多 对 多 的 关系 “如 图 1-5-4 所 示 )。 





图 1-5-4 








我 们 在 用 示意 图 表示 数据 的 逻辑 结构 时 ， 要 注意 两 皮 : 


。 将 每 一 个 数据 元 素 看 做 一 个 结 点 ， 用 圆 图 表示 。 


* 元 系 之 间 的 逻辑 关系 用 结 点 之 间 的 连 线 表示 ， 如 果 这 个 关系 是 有 方 
加 的 ， 那 么 用 带 盘 头 的 连 线 表示 。 


从 之 前 的 例子 也 可 以 看 出 ， 池 辑 结构 是 针对 有 具体 问题 的 ， 是 为 了 解决 东 
个 问题 ， 在 对 问题 理解 的 基础 上 ， 选 择 一 个 合适 的 数据 结构 表示 数据 元 
素 之 间 的 逻辑 关系 。 


1.5.2 ”物理 结构 


说 完了 远 辑 结构 ， 我 们 再 来 说 说 数据 的 物理 结构 (很 多 书 中 也 叫做 存储 
结构 ， 你 只 要 在 理解 上 把 它们 当 一 回 事 就 可 以 了 ) 。 








物理 结构 : 是 指数 据 的 馆 辑 结构 在 计算 机 中 的 存储 形式 。 





数据 是 数据 元 系 的 集合 ， 那 么 根据 物理 结构 的 定义 ， 实 际 上 就 是 如 何 把 
数据 元 素 存 储 到 计算 机 的 存储 器 中 。 存 储 器 主要 是 针对 内 存 而 言 的 ， 像 
人 硬盘、 软盘 、 光 盘 等 外 部 存储 器 的 数据 组 织 通常 用 文件 结构 来 描述 。 














数据 的 存储 结构 应 正确 有 反映 数据 元 系 之 间 的 迎 辑 关系， 这 才 是 最 为 天 键 
D REEE E N R A 0 


BUR TU ZA HY FF tik a PI SC IER: 顺序 存储 和 链 陈 存储 。 


1. 顺序 存储 结构 





顺序 存储 结构 :是 把 数据 元 素 存放 在 地 址 连续 的 存储 单元 里 ， 其 数据 间 
的 逻辑 关系 和 物理 关系 是 一 致 的 “如 图 1-5-5 所 示 )〉。 





图 1-5-5 


这 种 存储 络 构 其 实 很 简单 ， 说 日 了 ， 就 是 排队 占 位 。 大 家 都 按 顺 序 排 

好 ， 每 个 人 占 一 小 段 空间 ， 大 家 谁 也 别 插 谁 的 队 。 我 们 之 前 学 计算 机 语 
言 时 ， 数 组 就 是 这 样 的 顺序 存储 结构 。 当 你 告诉 计算 机 ， 你 要 建立 一 个 
有 9 个 整 型 数据 的 数组 时 ， 计 算 机 惑 在 内 存 中 找 了 片 空地 ， 按 照 一 个 整 
型 所 占 位 置 的 大 小 乘 以 9， 开 辟 一 段 连续 的 空间 ， 于 是 第 一 个 数组 数据 
就 放 在 第 一 个 位 置 ， 第 二 个 数据 放 在 第 二 个 ， 这 样 依次 摆 放 。 


2. 链 式 存储 结构 


如 果 就 是 这 么 简单 和 有 规律 ， 一 切 就 好 办 了 。 可 实际 上 ， 总 会 有 人 插 
队 ， 也 会 有 人 要 上 出 所、 有 人 会 放弃 排队 。 所 以 这 个 队伍 当中 会 添加 新 
成 员 ， 也 有 可 能 会 去 掉 老 元 素 ， 整 个 结构 时 刻 都 处 于 变化 中 。 显 然 ， 面 
对 这 样 时 常 要 变化 的 结构 ， 顺 序 存储 古 不 科学 的 。 那 怎么 办 呢 ? 








现在 如 银行 、 医 院 等 地 方 ， 设 置 了 排队 系统 ， 也 就 是 每 个 人 去 了 ， 先 领 
个 号 ， 等 着 叫 号 ， 叫 到 时 去 办 理 业 务 或 看 病 。 在 等 待 的 时 候 ， 你 爱 在 
WER, TARE WERKES., HAHAH, REK ERK 
行 。 你 关注 的 是 前 一 个 号 有 没有 被 叫 到 ， 叫 到 了 ， 下 一 个 就 轮 到 了 。 

















链 式 存储 结构 :是 把 数据 元 素 存 放 在 任意 的 存储 单元 里 ， 这 组 存储 单元 
可 以 是 连续 的 ， 也 可 以 是 不 连续 的 。 数 据 元 素 的 存储 关系 并 不 能 反映 其 
逻辑 关系 ， 因 此 需要 用 一 个 指针 存放 数据 元 素 的 地 址 ， 这 样 通过 地 址 区 
可 以 找到 相关 联 数据 元 素 的 位 置 〈 如 图 1-5-6 所 示 ) 。 





图 1-5-6 





显然 ， 链 式 存 储 束 灵活 多 了 ， 数 据 存 在 哪里 不 重要 ， 只 要 有 一 个 指针 存 


放 了 相应 的 地 址 就 能 找到 它 了 。 





前 几 年 香港 有 部 电影 叫 《无 间 道 》， 大 陆 还 有 部 电视 剧 叫 《潜伏 》， 都 
很 火 ， 不 知道 大 家 有 没有 看 过 。 大 致 说 的 是 ， 茶 一 方 潜伏 在 政 人 的 内 
部 ， 进 行 一 些 情报 收集 工作 。 为 了 不 其 露 每 个 潜伏 人 员 的 真实 丑 份 ， 往 
往 都 是 单线 联系 ， 只 有 上 线 知 道 下 线 是 谁 ， 并 且 是 通过 暗号 来 联络 。 正 
各 情况 下 ， 情 报 是 可 以 顺利 地 上 传 下 达 的 ， 但 是 如 休 茶 个 链条 中 结 点 的 
同志 牺牲 了 ， 那 就 抹 烦 了 ， 因 为 其 他 人 不 知道 上 线 或 者 下 线 是 谁 ， 后 果 
束 很 严重 。 比 如 在 《无 间 道 》 中 ， 梁 朝 伟 是 党 方 在 黑社会 中 的 卧底 ， 一 
直 古 与 黄秋生 扮演 的 警官 联络 ， 可 当 黄 遇害 后 ， 梁 就 无 法 证 明 自 己 是 一 
个 警察 。 所 以 影片 的 结尾 ， 当 染 旨 伟 用 枪 指 看 刘德华 的 头 说 ,“ 对 不 
起 , Tee. "XIE ERIE: “MERE? ”是 呀 ， 当 没有 人 可 
以 证 明 你 号 份 的 时 候 ， 谁 知道 你 是 谁 呢 ? 影片 看 到 这 里 ， 多 少 让 人 有 些 
响 咕 感慨。 这 其 实 就 是 链 式 关系 的 一 个 现实 样 例 。 














远 辑 结 构 是 面向 问题 的 ， 而 物理 结构 残 是 面向 计算 机 的 ， 其 基本 的 目标 
号 是 将 数据 及 其 逻辑 关系 存储 到 计算 机 的 内 存 中 。 


1.6 ”抽象 数据 类 型 
1.6.1 数据 类 型 


a ne lean eae eer eee 
总称 。 


数据 类 型 是 按照 值 的 不 同 进行 划分 的 。 在 高 级 语言 中 ， 每 个 变量 、 第 量 
和 表达 式 都 有 各 目的 取 值 范 围 。 类 型 就 用 来 说 明 变 量 或 表达 式 的 取 值 范 
围 和 所 能 进行 的 操作 。 


当年 那些 设计 计算 机 语言 的 人 ， 为 什么 会 考虑 到 数据 类 型 呢 ? 


比如 ， 大 家 都 需要 住房 子 ， 也 者 希望 房子 越 大 越 好 。 但 显然 ， 没 有 钱 ， 
考虑 房子 是 没 喻 意义 的 。 于 是 商品 房 就 出 现 了 各 种 各 样 的 房型 ， 有 别墅 
的 ， 有 错 层 的 ， 有 单间 的 ;， 有 一 百 多 平米 的 ， 也 有 几 十 平米 的 ， 甚 至 在 
北京 还 出 现 了 采 宫 公 沾 一 一 只 有 两 平米 的 房间 .….…. 这 样 束 满 足 了 不 同人 


的 需要 。 











同样 ， 在 计算 机 中 ， 内 存 也 不 是 无 限 大 的 ， 你 要 计算 一 个 如 1+1=2、 
3+5=8 这 样 的 整 型 数字 的 加 减 乘 除 运 算 ， 显 然 不 需要 开辟 很 大 的 适合 小 
数 甚 至 字符 运算 的 内 存 空 间 。 于 是 计算 机 的 研究 者 们 就 考 夸 ， 要 对 数据 
进行 分 类 ， 分 出 来 多 种 数据 类 型 。 





在 C 语 言 中 ， 按 照 取 值 的 不 同 ， 数 据 类 型 可 以 分 为 两 类 ; 


。 原子 类 型 : 是 不 可 以 再 分 解 的 基本 类 型 ， 包 括 整 型 、 实 型 、 字 符 型 
等 。 

结构 类 型 : 由 知 干 个 类 型 组 合 而 成 ， 是 可 以 再 分 解 的。 例如 ， 整 型 

数组 是 由 知 干 整 型 数据 组 成 的 。 








比如 ， 在 C 语 言 中 变量 声明 int ab， 这 就 意味 着 ， 在 给 变量 a 和 b 赋 值 时 不 
能 超出 int 的 取 值 范围 ， 变 量 a 和 b 之 间 的 运算 只 能 是 int 类 型 所 允许 的 运 
R 








因为 不 同 的 计算 机 有 不 同 的 便 件 系统 ， 这 就 要 求 程 序 语言 最 终 通 过 编译 
铝 或 解释 器 转换 成 底层 语言 ， 如 汇编 语言 甚至 是 通过 机 器 语言 的 数据 类 
型 来 实现 的 。 可 事实 上 ， 局 级 语言 的 编程 者 不 省 最 终 程序 运行 在 什么 计 
算 机 上 ， 他 的 目的 就 是 为 了 实现 两 个 整 型 数字 的 运算 ， 如 at+b、a-b、 
axb 和 ab 等 ， 他 才 不 关心 整数 在 计算 机 内 部 是 如 何 表示 的 ， 也 不 想 知 这 
CPU 为 了 实现 1+2 进 行 几 次 开关 操作 ， 这 些 操作 是 如 何 实现 的 ， 对 高 级 
语言 开发 者 来 讲 根本 不 重要 。 于 是 我 们 就 会 考虑 ， 无 论 什么 计算 机 、 什 
么 计算 机 语言 ， 大 都 会 面临 着 如 整数 运算 、 实 数 运算 、 字 符 运 算 等 操 
作 ， 我 们 可 以 考虑 把 它们 部 抽 象 出 来 。 






































抽象 是 指 抽 取出 事物 具有 的 普遍 性 的 本 质 。 它 是 抽出 问题 的 特征 而 忽略 
非 本 质 的 细 市 ， 是 对 基体 事物 的 一 个 概括 。 抽 象 是 一 种 思考 问题 的 方 
式 ， 它 隐藏 了 繁杂 的 细节 ， 只 保留 实现 目标 所 必需 的 信息 。 


16.2 ”抽象 数据 类 型 
我 们 对 已 有 的 数据 类 型 进行 抽象 ， 就 有 了 抽象 数据 类 型 。 


抽象 数据 类 型 (Abstract Data Type, ADT) : 是 指 一 个 数学 模型 及 定义 
在 该 模型 上 的 一 组 操作 。 抽 象 数据 类 型 的 定义 仅 取 决 于 它 的 一 组 逻辑 特 
性 ， 而 与 其 在 计算 机 内 部 如 何 表 示 和 实现 无 关 。 


比如 刚才 的 例子 ， 各 个 计算 机 ， 不 管 是 大 型 机 、 小 型 机 、PC、 平 板 电 
脑 、PDA， 甚 至 镶 能 手机 都 拥有 ”整数 ?类 型 ， 也 需要 整数 间 的 运算 ， 那 
么 整 型 其 实 就 是 一 个 抽象 数据 类 型 ， 尽 管 它 在 上 面 提 到 的 这 些 在 不 同 计 
算 机 中 实现 方法 上 可 能 不 一 样 ， 但 由 于 其 定义 的 数学 特性 相同 ， 在 计算 
机 编程 者 看 来 ， 它 们 都 是 相同 的 。 因 此 , “抽象 ”的 音义 在 于 数据 类 型 的 
数 学 抽象 特性 。 





而 且 ， 抽 象 数据 类 型 不 仅仅 指 那些 已 经 定义 并 实现 的 数据 类 型 ， 还 可 以 
征 计算 机 编程 者 在 设计 软件 程序 时 上 自己 定义 的 数据 类 型 ， 比 如 我 们 编写 
关于 计算 机 绘图 或 者 地 图 类 的 软件 系统 ， 经 冲 都 会 用 到 坐标 。 也 就 是 

说 ， 总 是 有 成 对 出 现 的 x 和 y， 在 3D 系 统 中 还 有 z 出 现 ， 既 然 这 三 个 整 型 
数字 是 始终 在 一 起 出 现 ， 我 们 惑 定 义 一 个 叫 point 的 抽象 数据 类 型 ， 它 有 
X、y、z 三 个 整 型 变量 ， 这 样 我 们 很 方便 地 操作 一 个 point 数 据 变量 就 能 
知道 这 一 点 的 坐标 了 。 

















根据 抽象 数据 类 型 的 定义 ， 它 还 包括 定义 在 该 模型 上 的 一 组 操作 。 惑 
像 “ 超 级 玛丽 ”这 个 经 典 的 任天堂 游戏 ， 里 面 的 游戏 主角 是 马里 奥 
(Mario) 。 我 们 给 他 定义 了 几 种 基本 操作 ， 走 (前 进 、 后 退 、 上 、 

下 ) 、 跳 、 打 子弹 等 。 一 个 抽象 数据 类 型 定义 了 : 一 个 数据 对 象 、 数 据 
对 象 中 各 数据 元 素 之 间 的 关系 及 对 数据 元 素 的 操作 。 人 至 于 ， 一 个 抽象 数 
据 类 型 到 底 需 要 哪些 操作 ， 这 就 只 能 由 设计 者 根据 实际 需要 来 定 。 像 马 
里 奥 ， 可 能 开始 只 有 两 种 操作 ， 走 和 跳 ， 后 来 发 现 应 该 要 增加 一 种 打 子 
弹 的 操作 ， 再 后 来 发 现 有 些 玩家 希 户 它 可 以 走 得 快 一 点 ， 束 有 了 按 住 打 
子弹 键 后 前 进 就 会 *" 跑 ”的 操作 。 这 都 是 根据 实际 情况 来 设计 的 。 
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ada A 


图 1-6-1 


事实 上 ， 抽 象 数据 类 型 体现 了 程序 设计 中 问题 分 解 、 抽 象 和 信息 隐藏 的 
特性 。 抽 和 象 数据 类 型 把 实际 生活 中 的 问题 分 解 为 多 个 规模 小 且 容 易 处 理 
的 问题 ， 然 后 建立 一 个 计算 机 能 处 理 的 数据 模型 ， 并 把 每 个 功能 模块 的 
实现 细 市 作为 一 个 独立 的 单元 ， 从 而 使 具体 实现 过 程 隐藏 起 来 。 


为 了 便于 在 之 后 的 讲解 中 对 抽象 数据 类 型 进行 规范 的 描述 ， 我 们 给 出 了 


描述 抽象 数据 类 型 的 标准 格式 : 


ADT 
抽象 数据 类 型 名 


数据 元 素 之 间 逻 辑 关 系 的 定义 
Operation 
操作 1 
初始 条 件 
操作 结果 描 ; 
操作 2 


Data 











& 




















操作 n 


endADT 


1.7 总 结 回顾 


今天 首先 用 我 一 个 不 争气 的 学 生 为 例子 ， 说 明 数 据 结构 很 重要 。 接 着 讲 
了 数据 结构 的 起 源 ， 说 白 了 ， 残 是 一 老外 ， 觉 得 编程 这 玩意 儿 不 弄 得 复 
杂 点 ， 不 能 证 明 他 厉害 ， 所 以 推出 “数据 结构 ”这 一 谍 程 ， 让 所 有 学 编程 
的 人 “ 吾 受 它 带 来 的 乐趣 ”或 者 “体验 被 折磨 后 无 尽 的 烦恼 ”。 





接着 ， 正 式 介绍 了 数据 结构 的 一 些 相关 概念 ， 如 图 1-7-1 所 示 。 
数据 元 素 数据 元 素 META 数据 元 素 
数据 项 数据 项 2 数据 项 1 数据 项 2 数据 项 1 数据 项 数据 项 1 ”数据 项 2 


图 1-7-1 





由 这 些 概念 ， 给 出 了 数据 结构 的 定义 : 数据 结构 是 相互 之 间 存 在 一 种 或 
多 种 特定 关系 的 数据 元 素 的 集合 。 同 样 是 结构 ， 从 不 同 的 角度 来 讨论 ， 


会 有 不 同 的 分 类 ， 如 图 1-7-2 所 示 。 


eva eval 





KoM EEN 
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图 1-7-2 


之 后 ， 我 们 还 介绍 了 抽象 数据 类 型 及 它 的 描述 方法 ， 为 今后 的 诬 程 打下 


基础 。 


1.8 结尾 语 





最 后 ， 我 想 对 那些 已 经 开始 自学 数据 结构 的 同学 说 ， 可 能 你 们 会 困惑 、 
不 懂 、 不 理解 、 不 会 应 用 ， 甚 至 不 知 所 云 。 可 实际 上 ， 无 论 学 什么 ， 痢 
古 要 努力 才 可 以 学 到 真 东 西 。 只 有 真正 掌握 搁 术 的 人 ， 才 有 可 能 去 至 用 
它 。 如 果 你 中 途 放 弃 了 ， 之 前 所 有 的 努力 和 付出 都 会 变 得 没有 价值 。 学 
会 游泳 难 吗 ?掌握 英语 口语 难 吗 ? 可 能 是 难 ， 但 在 掌握 了 的 人 眼 里 ， 这 
根本 不 算 什么 , “就 那么 回 事 呀 ?”。 只 要 你 相信 自己 一 定 可 以 学 得 会 、 学 
得 好 ， 既 然 无 数 人 已 经 掌握 了 ， 你 赁 什么 不 行 。 














你 对 着 别人 很 牛 地 说 :“ 数 据 结构 一 一 就 那么 回 








WSC, POMC AP Ta RAR LTE, BALANTAN? OT 


下 课 。 


算法 : 
算法 是 解决 特定 问题 求解 步骤 的 描述 ， 在 计算 机 中 表现 为 指令 的 有 限 序 
列 ， 并 且 每 条 指令 表示 一 个 或 多 个 操作 。 





2.1 开场 日 


各位 同学 大 家 好 。 


ERE, 有 同 学 対 我 況 , AM, RI SPR, ee aR BC 
什么 的 ， 你 也 太 压 大 它 的 难度 了 。 








是 呀 ， 我 好 像 是 强调 了 数据 结构 比较 搞 脑子 ， 而 上 次 课 ， 其 实 还 没 拿 出 
复杂 的 东西 来 说 道 。 不 是 不 想 ， 是 没 必要 ， 第 一 次 课 束 把 你 们 糊弄 曼 ， 
ABLE DUT A, BRINE NS? 你 们 看 ， 今 天 来 的 人 数 和 第 一 
次 差不多 ， 而 且 暂 时 还 没有 睡觉 的 。 











今天 我 们 介绍 的 内 容 在 难度 上 束 有 所 增加 了 ， 做 好 准备 了 吗 ? 





2.2 ”数据 结构 与 算法 关系 


我 们 这 门 读 程 叫 数据 结构 ， 但 很 多 时 候 我 们 会 讲 到 算法 ， 以 及 它们 之 间 
的 关系 。 市 场 上 也 有 不 少 书 叫 “ 数 据 结 构 与 算法 分 析 ” 这 样 的 名 字 。 


有 人 可 能 就 要 问 了 ， 那 你 到 底 是 只 讲 数据 结构 呢 ， 还 是 和 算法 一 起 讲 ? 
它们 之 间 是 什么 关系 呢 ? 干吗 要 放 在 一 起 ? 


这 问题 怎么 回答 。 打 个 比方 吧 ， 今 天 是 你 女友 生日 ， 你 打算 请 女友 去 看 
爱情 音乐 剧 ， 到 了 戏院 ， 抬 头 一 看 一 一 《深山 伯 》18: 00 开 演 。 咽 ， 怎 
么 会 是 这 样 ? 一 问 才 知 ， 今 天 饰演 视 英 台 的 演员 生病 ， 所 以 梁山 伯 唱 独 
角 戏 。 真 是 搞笑 了 ， 这 还 有 什么 看 头 。 于 是 你 们 打算 去 看 爱情 电影 。 到 
了 电影 院 ， 一 看 海报 一 一 《罗密欧 》， 是 不 是 名 字 写 错 了 ， 问 了 才 知 ， 
原来 饰演 朱丽叶 的 演员 因为 嫌弃 演出 费用 太 低 ， 中 途 退 演 了 。 制 片 方 考 
虑 到 已 经 开拍 ， 于 是 就 把 电影 名 字 定 为 《罗密欧 》， 主 要 讲 男 主 角 的 心 
路 旅程 。 哎 ， 这 电影 还 怎么 看 啊 ? 














事实 上 ， 数 据 结构 和 算法 也 是 类 似 的 关系 。 只 谈 数 据 结构 ， 当 然 是 可 

以 ， 我 们 可 以 在 很 短 的 时 间 融 把 几 种 重要 的 数据 结构 介绍 完 。 听 完 后 ， 

很 可 能 你 没什么 感觉 ， 不 知道 这 些 数 据 结构 有 何 用 处 。 但 如 果 我 们 再 把 
相应 的 算法 也 拿 来 讲 一 讲 ， 你 就 会 发 现 ， 甚 至 开始 感慨 : 哦 ， 计 算 机 界 
的 前 奉 们 ， 的 确 是 一 些 很 牛 很 牛 的 人 ， 他 们 使 得 很 多 看 似 很 难 解决 或 者 
没 法 解决 的 问题 ， 变 得 如 此 类 妙 和 神奇 。 











也 许 从 这 以 后 ， 慢 慢 地 你 们 中 的 一 些 人 会 开始 把 你 们 的 条 拜 对 象 ， 从 昨 
FRU, TAC TAG), Fer BEEK LB FE IN EK 
上 ， 那 我 就 非常 欣慰 了 。 而 且 ， 这 显然 是 一 种 成 熟 的 表现 ， 我 期 符 你 们 
中 多 一 点 这 样 的 人 ， 这 样 我 们 国家 的 软件 行业 ， 也 许 就 有 得 救 了 。 


不 过 话说 回来 ， 现 在 好 多 大 学 里 ， 通 常 都 是 把 “算法 ?分 出 一 门 课 单 独 讲 
的 ， 也 就 是 说 ， 在 《数据 结构 》 课 程 中 ， 就 算 谈 到 算法 ， 也 是 为 了 帮助 
理解 好 数据 结构 ， 并 不 会 详细 谈 及 算法 的 方方面面 。 我 们 的 读 程 也 是 按 


这 样 的 原则 来 展开 的 。 


2.3 ”两 种 算法 的 比较 





大 家 都 已 经 学 过 一 门 计 算 机 语言 ， 不 管 学 的 是 哪 一 种 ， 学 得 好 不 好 ， 好 
多 是 可 以 写 点 小 程序 了 。 现 在 我 要 求 你 写 一 个 求 1+2+3+.….+100 结 果 的 
程序 ， 你 应 该 怎么 写 呢 ? 








大 多 数 人 会 马上 写 出 下 面 的 C 语 言 代码 《或 者 其 他 语言 的 代码 ) : 


lites UNE = Opens OOF 
Oey (Gl Sse ect es) 
al 


sum = sum + i; 


printf("%d", sum); 


这 是 最 简单 的 计算 机 程序 之 一 ， 它 就 是 一 种 算法 ， 我 不 去 解释 这 代码 的 
含义 了 。 问 题 在 于 ， 你 的 第 一 直觉 是 这 样 写 的 ， 但 这 样 是 不 是 真 的 很 
好 ? 是 不 是 最 高 效 ? 











此 时 ， 我 不 得 不 把 伟大 数学 家 高 斯 的 童年 故事 拿 来 说 一 过， 也 许 你 们 都 
早已 经 昕 过 ， 但 不 妨 再 感受 一 下 ， 天 才 当 年 是 如 何 展 现 天 分 和 才华 的 。 


据说 18 世 纪 生 于 德国 小 村 庄 的 高 斯 ， 上 小 学 的 一 天 ， 课 堂 很 乱 ， 就 像 我 
们 现在 下 面 那些 盆 卿 私语 或 者 拿 着 手机 不 停摆 弄 的 同学 一 样 ， 老 师 非 常 
生气 ， 后 果 自 然 也 很 严重 。 于 是 老师 在 放学 时 ， 就 要 求 每 个 学 生 都 计算 
1+2+...+100 的 结果 ， 谁 先 算出 来 谁 先 回 家 。 








天 才 当 然 不 会 被 这 样 的 问题 难 倒 ， 高 斯 很 快 就 得 出 了 答案 ， 是 5050。 老 
师 非常 惊讶 ， 因 为 他 自己 想必 也 是 通过 1+2=3，3+3=6，6+4=10， 

ei 4950+100=5050 这 样 算出 来 的 ， 也 算 了 很 久 很 入 。 说 不 定 为 了 怕 
错 ， 还 算 了 两 三 裔 。 可 眼前 这 个 少年 ， 为 何 可 以 这 么 快 地 得 出 结果 ? 


高 斯 解释 道 
sum= 1+ 24+ 3+.. + 99+ 100 
sum = 100+ 99+ Wta + 2+ 1 

2xsum= 101+101+101+.. + 101+ 101 


ーー ーーーーーー デ 


共 100 4 


所 以 Sum=5050 


用 程序 来 实现 如 下 : 


int sum = 0,n = 100; 
SU Slee fay). IS ih fe 
printf("%d", sum); 


神童 就 是 神童 ， 他 用 的 方法 相当 于 另 一 种 求 等 差 数列 的 算法 ， 不 仅仅 可 
以 用 于 1 加 到 100， 就 是 加 到 一 于、 一 万 、 一 亿 需 要 更 改 整 型 变量 类 型 
为 长 整 型 ， 否 则 会 游 出 ) ， 也 就 是 瞬间 之 事 。 但 如 果 用 刚才 的 程序 ， 显 
然 计算 机 要 循环 一 千 、 一 万 、 一 亿 次 的 加 法 运算 。 人 脑 比 电脑 算得 快 ， 
似乎 成 为 了 现实 。 








2.4 算法 定义 


什么 是 算法 呢 ? 算法 是 描述 解决 问题 的 方法 。 算 法 (Algorithm) 这 个 单 
词 最 早出 现在 波斯 数学 家 阿 勒 : 花 刺 子 密 在 公元 825 年 《相当 于 我 们 中 国 
的 唐朝时 期 ) 所 写 的 《印度 数字 算术 》 中 。 如 今 普 所 认可 的 对 算法 的 定 
Me: 算法 是 解 决 特定 问题 求解 步骤 的 描述 ， 在 计算 机 中 表现 为 指令 的 
有 限 序列 ， 并 且 每 条 指令 表示 一 个 或 多 个 操作 。 








人 





那 我 就 要 问 问 你 们 ， 有 没有 通用 的 算法 呀 ? 这 个 问题 其 实 很 弱智 ， 就 像 
问 有 没有 可 以 包 治 百 病 的 药 呀 ! 


现实 世界 中 的 问题 千奇百怪 ， 算 法 当然 也 就 千变万化 ， 没 有 通用 的 算法 
可 以 解决 所 有 的 问题 。 甚 至 解决 一 个 小 问题 ， 很 优秀 的 算法 却 不 一 定 适 


=> 
TES 





算法 定义 中 ， 提 到 了 指令 ， 指 令 能 被 人 或 机 器 等 计算 装置 执行 。 它 可 以 
征 计算 机 指令 ， 也 可 以 是 我 们 平时 的 语言 文字 。 








为 了 解决 东 个 或 条 类 问题 ， 需 要 把 指令 表示 成 一 定 的 操作 序列 ， 操 作 序 
列 包括 一 组 操作 ， 每 一 个 操作 都 完成 特定 的 功能 ， 这 融 是 算法 了 。 


2.5 算法 的 特性 


算法 具有 五 个 基本 特性 : 输入 、 输 出 、 有 穷 性 、 确 定性 和 可 行 性 。 


2.5.1 输入 输出 





输入 和 输出 特性 比较 容易 理解 ， 算 法 具有 和 零 个 或 多 个 输入 。 尺 管 对 于 绝 
大 多 数 算法 来 说 ， 输 入 参数 都 是 必要 的 ， 但 对 于 个 别 情况 ， 如 打 

印 “helloworld! ”这 样 的 代码 ， 不 需要 任何 输入 参数 ， 因 此 算法 的 输入 
可 以 是 零 个 。 算 法 至 少 有 一 个 或 多 个 输出 ， 算 法 是 一 定 需要 输出 的 ， 不 
需要 输出 ， 你 用 这 个 算法 干吗 ? 输出 的 形式 可 以 是 打印 输出 ， 也 可 以 是 
返回 一 个 或 多 个 值 等 。 








2.5.2 有 穷 性 





ANE: 指 算法 在 执行 有 限 的 步骤 之 后 ， 目 动 结束 而 不 会 出 现 无 限 循 
环 ， 并 且 每 一 个 步骤 在 可 接受 的 时 间 内 完成 。 现 实 中 经 党 会 写 出 死 循环 
的 代码 ， 这 惑 是 不 满足 有 穷 性 。 当 然 这 里 有 穷 的 概念 并 不 是 纯 数学 意义 
的 ， 而 是 在 实际 应 用 当中 合理 的 、 可 以 接受 的 “有 边界 ”。 你 说 你 写 一 个 
算法 ， 计 算 机 需要 算 上 个 二 十 年 ， 一 定 会 结束 ， 它 在 数学 意义 上 是 有 穷 
了 ， 可 是 媳妇 都 获 成 区 了 ， 算 法 的 意义 也 不 就 大 了 。 











2.5.3 ”确定 性 


确定 性 : 算法 的 每 一 步骤 都 具有 确定 的 含义 ， 不 会 出 现 二 义 性 。 算 法 在 
一 定 条 件 下 ， 只 有 一 条 执行 路 径 ， 相 同 的 输入 只 能 有 唯一 的 输出 结 
算法 的 每 个 步 又 被 精确 定义 而 无 疏 义 。 





2.5.4 可 行 性 


可 行 性 : 算法 的 每 一 步 都 必须 是 可 行 的 ， 也 就 是 说， 每 一 步 都 能 够 通过 
执行 有 限 次 数 完成 。 可 行 性 意味 着 算法 可 以 转换 为 程序 上 机 运行 ， 并 得 
到 正确 的 结果 。 尽 管 在 目前 计算 机 界 也 存在 那 种 没有 实现 的 极为 复杂 的 
算法 ， 不 是 说 理论 上 不 能 实现 ， 而 是 因为 过 于 复杂 ， 我 们 当前 的 编程 方 
法 、 工 具 和 大 脑 限 制 了 这 个 工作 ， 不 过 这 都 是 理论 研究 领域 的 问题 ， 不 
属于 我 们 现在 要 考虑 的 范围 。 








2.6 算法 设计 的 要 求 





刚才 我 们 谈 到 了 ， 算 法 不 是 唯一 的 。 也 就 是 说 ， 同 一 个 问题 ， 可 以 有 多 
种 解决 问题 的 算法 。 这 可 能 让 那些 意 年 只 做 有 标准 答 守 题 目的 同学 失望 
了 ， 他 们 多 么 希望 存在 标准 答案 ， 只 有 一 个 是 正确 的 ， 把 它 背 下 来 ， 需 
要 的 时 候 套 用 就 可 以 了 。 不 过 话说 回来 ， 尽 管 算法 不 唯一 ， 相 对 好 的 算 
法 还 是 存在 的 。 和 掌握 好 的 算法 ， 对 我 们 解决 问题 很 有 帮助 ， 人 否则 前 人 的 
智慧 我 们 不 能 利用 ， 就 都 得 自己 从 头 研究 了 。 那 么 什么 才 叫 好 的 算法 
We? 


嗯 ， 没 错 ， 有 同学 说 ， 好 的 算法 ， 起 码 要 是 正确 的 ， 连 正确 都 谈 不 上 ， 
还 谈 什么 别 的 要 求 ? 


2.6.1 正确 性 


正确 性 : 算法 的 正确 性 是 指 算法 至 少 应 该 具有 输入 、 输 出 和 加 工 处 理 无 
歧义 性 、 能 正确 反映 问题 的 需求 、 能 够 得 到 问题 的 正确 答案 。 





但 是 算法 的 “正确 ? 通 癌 在 用 法 上 有 很 大 的 普 别 ， 大 体 分 为 以 下 四 个 层 
次 。 1. 算 法 程序 没有 语法 错误 。 2. 算 法 程序 对 于 合法 的 输入 数据 能 够 产 
生 满 足 要 求 的 输出 结果 。 3. 算 法 程序 对 于 非法 的 输入 数据 能 够 得 出 满足 
规格 说 明 的 结果 。 4. 算 法 程序 对 于 精心 选择 的 ， 甚 至 刁难 的 测试 数据 都 
有 满足 要 求 的 输出 结果 。 











对 于 这 四 层 含义 ， 层 次 1 要 求 最 低 ， 但 是 仅仅 没有 语法 错误 实在 谈 不 上 
是 好 算法 。 这 就 如 同 仅仅 解决 歇 饱 ， 不 能 算是 生活 圣 福 一 样 。 而 层次 4 
是 最 困难 的 ， 我 们 几乎 不 可 能 逐一 验证 所 有 的 输入 部 得 到 正确 的 结果 。 





因此 算法 的 正确 性 在 大 部 分 情况 下 都 不 可 能 用 程序 来 证 明 ， 而 是 用 数学 
方法 证 明 的 。 证 明 一 个 复杂 算法 在 所 有 层次 上 都 是 正确 的 ， 代 价 非 常 昂 
贵 。 所 以 一 般 情况 下 ， 我 们 把 层次 3 作为 一 个 算法 是 否 正 确 的 标准 。 


好 算法 还 有 什么 特征 呢 ? 


很 好 ， 我 听 到 了 说 算法 容易 理解 。 没 错 ， 就 是 它 。 


2.6.2 ”可 读 性 








可 读 性 : 算法 设计 的 男 一 目的 是 为 了 便于 阅读 、 理 解 和 交流 。 


可 送 性 高 有 助 十 人 休 理 解 算法 , HER ET SAE EM R AK 
发 现 ， 并 且 难 于 调试 和 修改 。 


我 在 很 久 以 前 曾经 看 到 过 一 个 网 友 写 的 代码 ， 他 号 称 这 程序 是 “用 史上 
最 少 代码 实现 俄罗斯 方块 >。 因为 我 目 己 也 写 过 类 似 的 小 游戏 程序 ， 所 
以 想 研 究 一 下 他 是 如 何 写 的 。 由 于 他 追求 的 是 “最 少 代码 ”这 样 的 极致 ， 
使 得 他 的 代码 真 的 不 好 理解 。 也 许 除 了 计算 机 和 他 上 自己 ， 绝 大 多 数 人 是 
看 不 全 他 的 代码 的 。 





我 们 写 代 码 的 目的 ， 一 方面 是 为 了 让 计算 机 执行 ， 但 还 有 一 个 重要 的 目 
的 是 为 了 便于 他 人 阅读 ， 让 人 理解 和 交流 ， 自 己 将 来 也 可 能 阅读 ， 如 果 
可 读 性 不 好 ， 时 间 长 了 自己 都 不 知道 写 了 些 什 么 。 可 读 性 是 算法 (也 包 
括 实现 它 的 代码 ) 好 坏 很 重要 的 标志 。 








2.6.3 ”健壮 性 


一 个 好 的 算法 还 应 该 能 对 输入 数据 不 合法 的 情况 做 合适 的 处 理 。 比 如 输 
入 的 时 间或 者 距离 不 应 该 是 负数 等 。 





健壮 性 : 当 输 入 数据 不 合法 时 ， 算 法 也 能 做 出 相关 人 处理， 而 不 是 产生 弄 
种 或 莫名 其 妙 的 结果 。 





2.6.4 时 间 效 率 高 和 存储 量 低 





最 后 ， 好 的 算法 还 应 该 具备 时 间 效 率 高 和 存储 量 低 的 特点 。 


时 间 效 率 指 的 是 算法 的 执行 时 间 ， 对 于 同一 个 问题 ， 如 条 有 多 个 算法 能 
够 解决 ， 执 行 时 间 短 的 算法 效率 高 ， 执 行 时 间 长 的 效率 低 。 存 储量 需求 
指 的 是 算法 在 执行 过 程 中 需要 的 最 大 存储 空间 ， 主 要 指 算法 程序 运行 时 
所 占用 的 内 存 或 外 部 硬盘 存储 空间 。 设 计算 法 应 该 尽量 满足 时 间 效 率 高 
和 存储 量 低 的 需求 。 在 生活 中 ， 人 们 都 希望 花 最 少 的 钱 ， 用 最 短 的 时 
间 ， 办 最 大 的 事 ， 算 法 也 是 一 样 的 思想 ， 最 好 用 最 少 的 存储 空间 ， 花 最 
少 的 时 间 ， 办 成 同样 的 事 就 是 好 的 算法 。 求 100 个 人 的 高 考 成 绩 平 均 
分 ,与 求全 省 的 所 有 考生 的 成 绩 平 均 分 在 占用 时 间 和 内 存 存储 上 是 有 非 
光大 的 莽 芥 的 ， 我 们 卓然 是 仍 求 可 以 高 效率 和 低 存 储量 的 工法 来 解决 问 
题 。 

















综 上 ， 好 的 算法 ， 应 该 有 具有 正确 性 、 可 读 性 、 健 壮 性 、 高 效率 和 低 存 储 
量 的 特征 。 


2.7 算法 效率 的 度量 方法 


刚才 我 们 提 到 设计 算法 要 提高 效率 。 这 里 效率 大 都 指 算法 的 执行 时 间 。 
那么 我 们 如 何 度 量 一 个 算法 的 执行 时 间 呢 ? 





EMRA ERTES, foie”. MRA DESI Ame, RINA 
过 对 算法 的 数据 测试 ， 利 用 计算 机 的 计时 功能 ， 来 计算 不 同 算法 的 效率 


是 高 还 是 低 。 


2.7.1 事后 统计 方法 


事后 统计 方法 : 这 种 方法 主要 是 通过 设计 好 的 测试 程序 和 数据 ， 利 用 计 
> 
DEA JAIR. 














但 这 种 方法 显然 是 有 很 大 缺陷 的 : 











必须 依据 算法 事先 编制 好 程序 ， 这 通常 需要 花费 大 量 的 时 间 和 精 
力 。 如 果 编 制 出 来 发 现 它 根本 是 很 糟糕 的 算法 ， 不 是 竹 篮 打 水 一 场 
空 吗 ? 

时 间 的 比较 依赖 计算 机 硬件 和 软件 等 环境 因素 ， 有 时 会 掩盖 算法 本 
身 的 优 劣 。 要 知道 ， 现 在 的 一 台 四 核 处 理 器 的 计算 机 ， 跟 当年 
286、386、486 等 老爷 和 爷 辈 的 机 器 相 比 ， 在 处 理 算法 的 运算 速度 
上 ， 是 不 能 相提并论 的 ， 而 所 用 的 操作 系统 、 编 译 器 、 运 行 框架 等 
软件 的 不 同 ， 也 可 以 影响 它们 的 结果 ;就 算是 同一 台 机 器 ，CPU 使 
用 率 和 内 存 占用 情况 不 一 样 ， 也 会 造成 细微 的 差异 。 

算法 的 测试 数据 设计 困难 ， 并 且 程 序 的 运行 时 间 往 往 还 与 测试 数据 
的 规模 有 很 大 关系 ， 效 率 高 的 算法 在 小 的 测试 数据 面前 往往 得 不 到 
体现 。 比 如 10 个 数字 的 排序 ， 不 管用 什么 算法 ， 差 异 几乎 是 零 。 而 
如 果 有 一 百 万 个 随机 数字 排序 ， 那 不 同 算法 的 差异 就 非常 大 了 。 那 
么 我 们 为 了 比较 算法 ， 到 底 用 多 少数 据 来 测试 ， 这 是 很 难 判断 的 问 











jel 。 


基于 事后 统计 方法 有 这 样 那 样 的 缺陷 ， 我 们 考虑 不 予 采 纳 。 


2.7.2 事前 分 析 估 算 方 法 


我 们 的 计算 机 前 幸 们 ， 为 了 对 算法 的 评判 更 科学 ， 研 究 出 了 一 种 叫做 事 
前 分 析 估 算 的 方法 。 
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经 过 分 析 ， 我 们 发 现 ， 一 个 用 高 级 程序 语言 编写 的 程序 在 计算 机 上 运行 
时 所 消耗 的 时 间 取 决 于 下 列 因素 : 1 算法 采用 的 策略 、 方 法 。 2. 编 译 产 
生 的 代码 质量 。 3. 问 题 的 输入 规模 。 4. 机 器 执行 指令 的 速度 。 


第 1 条 当然 是 算法 好 坏 的 根本 ， 第 2 条 要 由 软件 来 文 持 ， 第 4 条 要 看 人 硬件 
性 能 。 也 就 是 说 ， 抛 开 这 些 与 计算 机 和 硬件、 软件 有 关 的 因素 ， 一 个 程序 
的 运行 时 间 ， 依 赖 于 算法 的 好 坏 和 问题 的 输入 规模 。 所 谓 问 题 输入 规模 
是 指 输入 量 的 多 少 。 


我 们 来 看 看 今天 刚 上 课时 举 的 例子 ， 两 种 求 和 的 算法 : 


* DUT *7 
* oy Inti 7 


Init Sum = Oy na = 1007 if. 

For (Gk SS Sle Ia <= Tye SiS) if 
{ 

sum = sum + i; [fe Ei NTA Oe 

/ 





printf("%d", sum); * PTL */ 


第 二 种 算法 : 





int sum = 0,n = 100; A NN 
SUMPSIT /2 /* ATU */ 
printf("%d", sum); PEAT ea. 
显然 ， 第 一 种 算法 ， 执 行 了 1+(n+l)+n+1l 次 =2n+3 次 ; 而 第 二 种 算法 ， 是 


1+1+1= A 事实 上 两 个 秘法 内 第 一 条 和 最 后 一 条 语句 是 一 样 的 ， 所 以 
我 们 关注 的 代码 其 : 实 是 中 间 的 那 部 分 ， 我 们 把 循环 看 作 一 个 整体 ， 忽 略 
S n a 那么 2 这 两 个 算法 其 ESC MEMS URN Are. BIE 
好 坏 显 而 易 见 








我 们 再 来 延伸 一 下 上 面 这 个 例子 : 


in te XS Os UM One =a21007 TE Rie. YL 
for (i = 1; i <= n; itt) 


Weal a) eal ns 
{ 
X++; /* 执行 hxn 次 */ 


sum = sum + xX; 


+ 
} 要 
printf("%d", sum); E aie ed 


这 个 例子 中 ，i 从 1 到 100， 每 次 都 要 让 j 循 环 100 次 ， 而 当中 的 x++ 和 
sum=sum+x: 其 实 就 是 1+2+3+...+10000， 也 就 是 100 


2 次 ， 所 以 这 个 算法 当中 ， 循 环 部 分 的 代码 整体 需要 执行 n 





2《〈 忽 略 循环 体 头 尾 的 开销 ) 次 。 显 然 这 个 算法 的 执行 次 数 对 于 同样 的 
输入 规模 n=100， 要 多 于 前 面 两 种 算法 ， 这 个 算法 的 执行 时 间 随 独 n 的 增 
加 也 将 远 远 多 于 前 面 两 个 。 

















此 时 你 会 看 到 ， 测 定 运 行 时 间 最 可 靠 的 方法 就 是 计算 对 运行 时 间 有 消耗 


的 基本 操作 的 执行 次 数 。 运 行 时 间 与 这 个 计数 成 正比 。 


我 们 不 关心 编写 程序 所 用 的 程序 设计 语言 是 什么 ， 也 不 关心 这 些 程序 将 
跑 在 什么 样 的 计算 机 中 ， 我 们 只 关心 它 所 实现 的 算法 。 这 样 ， 不 计 那 些 
循环 索引 的 递增 和 循环 终止 条 件 、 变 量 声明 、 打 印 结果 等 操作 ， 最 终 ， 
在 分 析 程 序 的 运行 时 间 时 ， 最 重要 的 是 把 程序 看 成 是 独立 于 程序 设计 语 
言 的 算法 或 一 系列 步骤 。 

















可 以 从 问题 描述 中 得 到 启示 ， 同 样 问题 的 输入 规模 是 n， 求 和 算法 的 第 
一 种 ， 求 1+2+...+n 需 要 一 段 代 码 运行 n 次 。 那 么 这 个 问题 的 输入 规模 使 
得 操作 数量 是 fn)=n， 显 然 运行 100 次 的 同一 段 代 码 规模 是 运算 10 次 的 10 
倍 。 而 第 二 种 ， 无 论 n 为 多 少 ， 运 行 次 数 都 为 1， 即 fmn)=1; 第 三 种 ， 运 
算 100 次 是 运算 10 次 的 1000 倍 。 因 为 它 是 f(n)=n?。 


我 们 在 分 析 一 个 算法 的 运行 时 间 时 ， 重 要 的 是 把 基本 操作 的 数量 与 输入 
ae 即 基本 操作 的 数量 必须 表示 成 输入 规模 的 图 数 〈 如 图 2- 
7-1 所 示 ) 。 


不 同 算法 的 操作 数量 对 比 


Hane 
ーー ヒー ビー 
123845 6 7 8 8 10 


问题 输入 规模 n 





图 2-7-1 


我 们 可 以 这 样 认 为 ， 随 者 n 值 的 越 来 越 大 ， 它 们 在 时 间 效 率 上 的 差异 也 
就 越 来 越 大 。 好 比 你 们 当中 有 些 人 每 天 都 在 学 习 ， 我 指 有 用 的 学 习 ， 而 
不 是 只 为 考试 的 死 读 书 ， 每 天 都 在 进步 ， 而 为 一 些 人 ， 打 打 游 戏 ， 睡 睡 
大 觉 。 入 校 时 大 家 都 一 样 ， 但 毕业 时 结果 可 能 就 大 不 一 样 ， 前 者 名 企 争 


tha, MARKERE. 


2.8 函数 的 渐 近 增长 


我 们 现在 来 判断 一 下 ， 以 下 两 个 算法 A 和 B 哪 个 更 好 。 假 设 两 个 算法 的 
输入 规模 都 是 n"， 算 法 A 要 做 2n+3 次 操作 ， 你 可 以 理解 为 先 有 一 个 n 次 的 
循环 ， 执 行 完 成 后 ， 再 有 一 个 n 次 循环 ， 最 后 有 三 次 赋值 或 运算 ， 共 
2n+3 次 操作 。 算 法 B 要 做 3n+1 次 操作 。 你 觉得 它们 谁 更 快 呢 ? 





准确 说 来 ， 答 案 是 不 一 定 的 〈 如 表 2-8-1 所 示 ) 。 














hak EA(2n+3) BEAN(2n) NBL) HEB (an) 
n=] 5 2 4 3 
= 2 7 4 1 6 
N=3 9 6 10 9 
n= 10 23 20 31 30 
n= 100 203 200 301 300 
表 2-8-1 


当 n=1 時 , 算法 A 政 率 不 如 算 法 B (次 数 比 算法 B 要 多 一 次 ) 。 而 当 n=2 

时 ， 两 者 效率 相同 ; 当 n>2 时 ， 算 法 A 融 开始 优 于 算法 B 了 ， 随 着 n 的 增 

加 ， 算 法 A 比 算法 B 越 来 越 好 了 《执行 的 次 数 比 B 要 少 ) 。 于 是 我 们 可 以 
得 出 结论 ， 算 法 A 总 体 上 要 好 过 算法 B。 


此 时 我 们 给 出 这 样 的 定义 ， 输 入 规模 n 在 没有 限制 的 情况 下 ， 只 要 超过 
一 个 数值 N， 这 个 函数 就 总 是 大 于 另 一 个 函数 ， 我 们 称 函数 是 渐 近 增长 


的 。 


函数 的 渐 近 增长 : 给 定 两 个 函数 f(n) 和 g(n)， 如 果 存 在 一 个 整数 N， 使 得 
对 于 所 有 的 n>N，f(n) 总 是 比 g(n) 大 ， 那 么 ， 我 们 说 f(n) 的 增长 渐 近 快 于 
g(n)。 





从 中 我 们 发 现 ， 随 着 n 的 增 大 ， 后 面 的 +3 还 是 +1 其 实 是 不 影响 最 终 的 算 
法 变化 的 ， 例 如 算法 A' 与 算法 B'"， 所 以 ， 我 们 可 以 忽略 这 些 加 法 常数 。 
后 面 的 例子 ， 这 样 的 常数 被 名 略 的 意义 可 能 会 更 加 明显 。 


我 们 来 看 第 二 个 例子 ， 算 法 C 是 4n+8， 算 法 D 是 2n2+1〈 如 表 2-8-2 所 
示 ) 

















RR | 算法 C (4n+8) BEC (n) 算法 D(2m+1) 算法 D' (nm) 
n=] 12 | 3 | 
n=2 16 2 0 4 
n=3 20 3 19 9 
n= 10 48 10 201 100 
n= 100 408 100 20 001 10.000 
n= 1000 4 008 1000 2000001 1000000 
表 2-8-2 


当 n<3 的 时 候 ， 


算法 C 要 差 于 算法 D 〈 因 为 算法 C 次 数 比 较 多 ) ， 但 当 n>3 


后 ， 算 法 C 的 优势 就 越 来 越 优 于 算法 D 了 ， 到 后 来 更 是 远 远 胜 过 。 而 当 
后 面 的 常数 去 掉 后 ， 我 们 发 现 其 实 结果 没有 发 生 改 变 。 甚 至 我 们 再 观察 
发 现 ， 哪 介 去 掉 与 n 相 乘 的 冲 数 ， 这 样 的 结果 也 没有 友 生 改变 ， 算 法 C 的 
次 数 随 着 n 的 增长 ， 还 是 远 小 于 算法 D'。 也 就 是 说 ， 与 最 高 次 项 相 乘 的 
常 数 井 不 重 要 。 

















我 们 再 来 看 第 三 个 例子 。 算 法 E 是 2n*+3n+1， 算 法 FE 是 2n3+3n+1〈 如 表 2- 
8-3 所 示 ) 。 

















RR “算法 E mn) 算法 E (nm) | 算法 F nA) | BEF (n’) 
j= 6 | 6 1 
n=2 15 4 23 8 
n=3 28 9 64 27 
n= 10 231 100 2031 1000 
n= 100 20 301 10 000 2000301 1000000 
表 2-8-3 








当 n=1 的 时 候 ， 算 法 E 与 算法 F 结 果 相 同 ， 但 当 n>1 后 ， 算 法 E 的 优势 就 要 
开始 优 于 算法 FE， 随 独 n 的 增 大 ， 差 异 非常 明显 。 通 过 观察 发 现 ， 最 高 次 
项 的 指数 大 的 ， 函 数 随 着 n 的 增长 ， 结 果 也 会 变 得 增长 特别 快 。 














我 们 来 看 最 后 一 个 例子 。 算 法 G 是 2n2， 算 法 H 是 3n+1， 算 法 [是 
2n?+3n+1 ( 如 表 2-8-4 所 示 ) 。 


次 数 算法 G( 2n ) | 算法 H( 3n+1 ) 


算法 | ( 2n°43n4t | 




















n=] 2 4 6 
n = 2 0 7 15 
1 に お 0U 16 66 
n= 10 200 31 231 
n= 100 20 000 301 20 301 
n = 1,000 2 000 000 3001 2 003 001 
n = 10,000 200 000 000 30 001 200 030 001 
n = 100,000 20 000 000 000 300 001 20 000 300 001 
n = 1,000,000 | 2 000 000 000 000 3000001 200.000 3000 001 
表 2-8-4 








这 组 数据 应 该 就 看 得 很 清楚 。 当 n 的 值 越 来 越 大 时 ， 你 会 发 现 ，3n+1 已 
经 没 法 和 2n* 的 结果 相 比 较 ， 最 终 儿 乎 可 以 忽略 不 计 。 也 就 是 说 ， 随 着 n 








值 变 得 非常 大 以 后 ， 算 法 G 其 实 已 经 很 趋 近 于 算法 I。 于 是 我 们 可 以 得 到 
这 样 一 个 结论 ， 判 断 一 个 算法 的 效率 时 ， 函 数 中 的 常数 和 其 他 次 要 项 管 
常 可 以 忽略 ， 而 更 应 该 关注 主 项 (最 高 阶 项 ) 的 阶 数 。 





判断 一 个 算法 好 不 好 ， 我 们 只 通过 少量 的 数据 是 不 能 做 出 准确 判断 的 。 
根据 刚才 的 几 个 样 例 ， 我 们 发 现 ， 如 果 我 们 可 以 对 比 这 几 个 算法 的 关键 
执行 次 数 函 数 的 渐 近 增长 性 ， 基 本 就 可 以 分 析出 茶 个 算法 ， 随 着 n 的 


増大 , 宅 会 越 来 越 佐 十 労 一 算法 , 或 者 越 来 越 差 十 兄 一 算法 。 送 其 突 就 
a 前 估算 方 法 的 理论 依据 ， 通 过 算法 时 间 复 杂 度 来 估算 算法 时 间 效 











2.9 ”算法 时 间 复 杂 度 
2.9.1 算法 时 间 复 杂 度 定义 





在 进行 算法 分 析 时 ， 语 句 总 的 执行 次 数 TCD 是 关于 问题 规模 n 的 函数 ， 

进而 分 析 TOn) 随 n 的 变化 情况 并 确定 TD 的 数量 级 。 算 法 的 时 间 复 杂 上 度 ， 
也 就 是 算法 的 时 间 量 度 ， 记 作 : T(n)=O(f(n))。 它 表示 随 问 题 规模 n 的 增 
大 ， 算 法 执行 时 间 的 增长 率 和 fm) 的 增长 雍 相 同 ， 称 作 算 法 的 新近 时 间 
复杂 度 ， 简 称 为 时 间 复 杂 度 。 其 中 f(o) 是 问题 规模 n 的 茶 个 函数 。 











这 样 用 大 写 O( ) 来 体现 算法 时 间 复 杂 度 的 记 法 ， 我 们 称 之 为 大 0 记 法 。 








一 般 情 况 下 ， 随 看 n 的 增 大 ，T(D) 增 长 最 慢 的 算法 为 最 优 算法 。 





显然 ， 由 此 算法 时 间 复 杂 度 的 定义 可 知 ， 我 们 的 三 个 求 和 算法 的 时 间 复 
林 度 分 别 为 O(n)，0O(1)，O(n*)。 我 们 分 别 给 它们 取 了 非 官方 的 名 称 ， 
O(1) 叫 常数 阶 、O(n) 叫 线性 阶 、O(n?) 叫 平方 阶 ， 当 然 ， 还 有 其 他 的 一 些 
阶 ， 我 们 之 后 会 介绍 。 





2.9.2 ”推导 大 O 阶 方法 


那么 如 何 分 析 一 个 算法 的 时 间 复 杂 度 呢 ? 即 如 何 推导 大 0 阶 呢 ? 我 们 给 
出 了 下 面 的 推导 方法 ， 基 本 上 ， 这 也 就 是 总 结 前 面 我 们 举 的 例子 。 





推导 大 O 阶 : 





1. 用 常数 1 取代 运行 时 间 中 的 所 有 加 法 常数 。 
2. 在 修改 后 的 运行 次 数 函 数 中 ， 只 保留 最 高 阶 项 。 
3. 如 果 最 高 阶 项 存在 且 不 是 1， 则 去 除 与 这 个 项 相 乘 的 常数 。 








得 到 的 结果 就 是 大 O 阶 。 





哈 ， 仿 佛 是 得 到 了 游戏 攻略 一 样 ， 我 们 好 像 已 经 得 到 了 一 个 推导 算法 时 
间 复 杂 度 的 万 能 公式 。 可 事实 上 ， 分 析 一 个 算法 的 时 间 复 杂 度 ， 没 有 这 
么 简单 ， 我 们 还 需要 多 看 几 个 例子 。 





2.9.3 ”常数 阶 





首先 顺序 结构 的 时 间 复 杂 度 。 下 面 这 个 算法 ， 也 就 是 刚才 的 第 二 种 算法 
《高 斯 算法 ) ， 为 什么 时 间 复 杂 度 不 是 O(3)， 而 是 O(1)。 





int sum = 0,n = 100; TENA 
SUM=en lect n/n /* TT im */ 
printf("%d", sum); AA 





这 个 算法 的 运行 次 数 函 数 是 fn)=3。 根 据 我 们 推导 大 0 阶 的 方法 ， 第 一 
步 束 是 把 常数 项 3 改 为 1。 在 保留 最 蜗 阶 项 时 发 现 ， 它 根本 没有 最 蜗 阶 
项 ， 所 以 这 个 算法 的 时 间 复 杂 度 为 O(])。 








a 
Ay, 即 : 











int sum = 0, n = 100; /* FTA */ 

SUn = (alee m ne es /* 执行 第 1 次 */ 
Sti SoG my fy ae /* 执行 第 2 次 */ 
SU = Gl 8 my Pom ee /* 执行 第 3 次 */ 
SUN = (GLE nD en/ /* 执行 第 4 次 */ 
Sume WE En hn/ /* 执行 第 5 次 */ 
am (lstS mt の /* 执行 第 6 次 */ 
SUME Gls imy 2m 72s /* 执行 第 7 次 */ 
Sum =n N 2; /* 执行 第 8 次 */ 
Sume- Glan nD 2 iy 2s /* 执行 第 9 次 */ 
ET /* 执行 第 10 次 */ 
printf("%d", sum); e a 


事实 上 无 论 n 为 多 少 ， 上 面 的 两 段 代码 就 是 3 次 和 12 次 执行 的 差异 。 这 种 


与 问题 的 大 小 无 天 (mn 的 多少 ) ， 执 行 时 间 和 恒定 的 算法 ， 我 们 称 之 为 具 
有 0O(1) 的 时 间 复 杂 度 ， 又 叫 常数 阶 。 








注意 : 不 管 这 个 第 数 古 多 少 ， 我 们 都 记 作 O(1)， 而 不 能 是 0(3)、0(12) 等 
其 他 任何 数字 ， 这 是 初学 者 常常 犯 的 错误 。 








对 于 分 文 结构 而 言 ， 无 论 是 真 ， 还 是 假 ， 执 行 的 次 数 部 是 恒定 的 ， 不 会 
随 着 n 的 变 大 而 发 生变 化 ， 所 以 单纯 的 分 支 结构 不 包含 在 循环 结构 
中 ) ， 其 时 间 复 杂 度 也 是 O(1)。 








2.9.4 线性 阶 


线性 阶 的 循环 结构 会 复杂 很 多 。 要 确定 菏 个 算法 的 阶 次 ， 我 们 第 第 需要 
确定 茶 个 特定 语句 或 茶 个 语句 集运 行 的 次 数 。 因 此 ， 我 们 要 分 析 算 法 的 
复杂 度 ， 关 键 就 是 要 分 析 循 环 结构 的 运行 情况 。 








下 面 这 段 代 码 ， 它 的 循环 的 时 间 复 杂 度 为 Om)， 因 为 循环 体 中 的 代码 须 
要 执行 n 次 。 


aine 2 
ON (I (Oh akc faye EE) 


/* 时 间 复 杂 度 为 0(1) 的 程序 步 又 序列 */ 


2.9.5 ”对 数 阶 








下 面 的 这 段 代码 ， 时 间 复 杂 度 又 是 多 少 呢 ? 


TNEecount .= 
while (count < n) 


COUNE = sCOUNIE 2 
/* 时 间 复 杂 度 为 0(1) 的 程序 步骤 序列 */ 





由 于 每 次 count 乘 以 2 之 后 ， 就 距离 n 更 近 了 一 分 。 也 就 是 说 ， 有 多 少 个 2 
相 乘 后 大 于 n， 则 会 退出 循环 。 由 2x=n 得 到 x=log2n。 所 以 这 个 循环 的 时 
间 复 杂 度 为 Oogn)。 





2.9.6 平方 阶 


下 面 例 子 是 一 个 循环 能 套 ， 它 的 内 循环 刚才 我 们 已 经 分 析 过 ， 时 间 复 杂 
度 为 O(n)。 


URIE hk Ii 
umole (EE =e (Oh ak” [gy ale) 


Om i= OM ea) 


/* 时 间 复 杂 度 为 0( 工 ) 的 程序 步骤 序列 */ 





而 对 于 外 层 的 循环 ， 不 过 是 内 部 这 个 时 间 复 杂 度 为 On) 的 语句 ， 再 循环 
n 次 。 所 以 这 段 代 码 的 时 间 复 杂 度 为 O(n?)。 





如 果 外 循环 的 循环 次 数 改 为 了 m， 时 间 复 淋 度 就 变 为 O(mxn)。 


a nie aka ae 
boaUN On) 


Om) 


/* 时 间 复 杂 度 为 0(1) 的 程序 步骤 序列 */ 





所 以 我 们 可 以 总 结 得 出 ， 循 环 的 时 间 复 杂 度 等 于 循环 体 的 复杂 度 乘 以 该 
循环 运行 的 次 数 。 





那么 下 面 这 个 循环 嵌 套 ， 它 的 时 间 复 杂 度 是 多 少 呢 ? 


BAKE abs. Je 

O (Cay On 

{ 
/* 注意 ] = i MAO */ 
RR En RA 





/* 时 间 复 杂 度 为 0(1) 的 程序 步骤 序列 */ 


由 于 当 i=0 时 ， 内 循环 执行 了 n 次 ， iei, 执行 了 n-1 次 ， neet 当 i=n-1 
时 ， 执 行 了 1 次 。 所 以 总 的 执行 次 数 为 : 


nt (1-1) +(0-2) ++ 12 ry! 


用 我 们 推导 大 O 阶 的 方法 ， 第 一 条 ， 没 有 加 法 常数 不 予 考虑 ， 第 二 条 ， 
只 保留 最 高 阶 项 ， 因 此 保留 n2/2; 第 三 条 ， 去 除 这 个 项 相 乘 的 和 常数， 也 
就 是 去 除 1/2， 最 终 这 段 代 码 的 时 间 复 林 度 为 O(n”)。 





从 这 个 例子 ， 我 们 也 可 以 得 到 一 个 经 验 ， 其 实 理解 大 0 推导 个 算 难 ， 难 
的 是 对 数列 的 一 些 相关 运算 ， creer a eg al ca BA, 所 
以 想 考 研 的 朋友 , a a 可 能 需要 强化 
你 的 数学 ， 特 别 是 数列 方面 的 知识 和 解 题 能 








我 们 继续 看 例子 ， 对 于 方法 调用 的 时 间 复 杂 上 度 又 如 何 分 析 。 


ale sabe <3] 2 
POr Gi S Oe ) 


function(i); 


上 面 这 段 代码 调用 一 个 函数 function 。 


void function(int count) 


print(count); 


函数 体 是 打印 这 个 参数 。 其 实 这 很 好 理解 ，function 函 数 的 时 间 复 杂 度 
是 O(1)。 所 以 整体 的 时 间 复 杂 度 为 O(n)。 


假如 function 是 下 面 这 样 的 : 


void function(int count) 


ne 
oe G COUunt oy < niet) 


/* 时 间 复 杂 度 为 0(1) 的 程序 步 又 序列 */ 


事实 上 ， 这 和 刚才 举 的 例子 是 一 样 的 ， 只 不 过 把 稻 僚 内 循环 放 到 了 函数 
中 ， 所 以 最 终 的 时 间 复 杂 度 为 O(n”)。 


下 面 这 段 相对 复杂 的 语句 : 


nt++; /* 执行 次 数 为 1 */ 
function(n); /* 执行 次 数 为 n */ 
anie apa 

TOE E a S N E) /* 执行 次 数 为 n2 */ 





function (i); 

k 

UN S O ED DU aar) /* 执行 次 数 为 n(n + 1)/2 */ 
Ron A Sp Te) 


/* 时 间 复 杂 度 为 0(1) 的 程序 步 又 序列 */ 


它 的 执行 次 数 fn)=1+n+n2+n(n+1)/2=3/2.n2+3/2.n+1， 根 据 推导 大 0O 阶 的 
方 法 , BAK BRAS AYN E SR Et O(n). 





2.10 常见 的 时 间 复 杂 度 
和 常见 的 时 间 复 杂 度 如 表 2-10-1 所 示 。 


表 2-10-1 


执行 次 数 。” ”函数 阶 ” 非 正式 术语 


12 O(1) 常数 阶 
2n+3 O(n) 线性 阶 
3n? +2n+1 O(n?) 平方 阶 


5log n+20 O(logn) 对 数 阶 
2n+3nlog n+19 O(nlogn) nlogn 阶 
6n3+2n2+3n+4 O(n?) ”立方 阶 
O(2『) ”指数 阶 
常用 的 时 间 复 杂 度 所 耗费 的 时 间 从 小 到 大 依次 是 : 


0(1)<0(logn)<0(n)<0(nlogn)<0(n2)<0(n2)<0(2")<0(n! )<0(n") 
我 们 前 面 已 经 谈 到 了 O(1) 常 数 阶 、O(ogn) 对 数 阶 、O(n) 线 性 阶 、O@mn 
2) 平 方 阶 等 ， 至 于 OClogn) 我 们 将 会 在 今后 的 课程 中 介绍 ， 而 像 Oa 
3)， 过 大 的 n 都 会 使 得 结果 变 得 不 现实 。 同 样 指数 阶 O(2 


n) 和 阶乘 阶 On!) 等 除非 是 很 小 的 n 值 ， 耕 则 哪怕 n 只 是 100， 都 是 哑 梦 般 
的 运行 时 间 。 上 所 以 这 种 不 切实 际 的 算法 时 间 复 杂 度 ， 一 般 我 们 都 不 去 讨 








2.11 最 坏 情况 与 平均 情况 


PEREHI a RARER, FRU ST, AR, Taek. RE, 
手机 三 大 件 ， 出 门 哪样 也 不 能 少 呀 。 于 是 回 家 找 。 打 开门 一 看 ， 手 机 就 
在 门口 玄关 的 台子 上 ， 原 来 是 出 门 穿 鞋 时 忘记 拿 了 。 这 当然 是 比较 好 ， 
基本 没 花 什么 时 间 寻 找 。 可 如 果 不 是 放 在 那里 ， 你 就 得 进去 到 处 找 ， 找 
完 客 厅 找 卧室 、 找 完 卧 室 找 厨 房 、 找 完 厨 房 找 卫生 间 ， 就 是 找 不 到 ， 时 
间 一 分 一 秒 的 过 去 ， 你 突然 想起 来 ， 可 以 用 家 里 座机 打 一 下 手机 ， 听 着 
手机 铃声 来 找 呀 ， 真 是 沫 。 终 于 找到 了 ， 在 床上 枕头 下 面 。 你 再 去 上 

班 ， 述 到 。 见 鬼 ， 这 一 年 的 全 勒 奖 ， 就 因为 找 手机 给 黄 了 。 

















找 东 西 有 运气 好 的 时 候 ， 也 有 怎么 也 找 不 到 的 情况 。 但 在 现实 中 ， 通 常 
Gee geese nea rane ee PA, eee eran 
况 居多 。 








算法 的 分 析 也 是 类 似 ， 我 们 查找 一 个 有 n 个 随机 数字 数组 中 的 某 个 数 
字 ， 最 好 的 情况 是 第 一 个 数字 就 是 ， 那 么 算法 的 时 间 复 杂 度 为 0(1)， 但 
也 有 可 能 这 个 数字 就 在 最 后 一 个 位 置 上 竺 着， 那么 算法 的 时 间 复 杂 度 就 
是 O(n)， 这 是 最 坏 的 一 种 情况 了 。 











最 坏 情 况 运行 时 间 是 一 种 保证 ， 那 就 是 运行 时 间 将 不 会 再 坏 了 。 在 应 用 
中 ， 这 是 一 种 最 重要 的 需求 ， 通 常 ， 除 非特 别 指定 ， 我 们 提 到 的 运行 时 
间 都 是 最 坏 情 况 的 运行 时 间 。 











而 平均 运行 时 间 也 就 是 从 概率 的 角度 看 ， 这 个 数字 在 每 一 个 位 置 的 可 能 
性 是 相同 的 ， 所 以 平均 的 查找 时 间 为 /2 次 后 发 现 这 个 目标 元 系 。 








平均 运行 时 间 是 所 有 情况 中 最 有 意义 的 ， 因 为 它 是 期 望 的 运行 时 间 。 也 
就 是 说 ， 我 们 运行 一 段 程序 代码 时 ， 是 希望 看 到 平均 运行 时 间 的 。 可 现 
实 中 ， 平 均 运 行 时 间 很 难 通 过 分 析 得 到 ， 一 般 都 是 通过 运行 一 定数 量 的 
实验 数据 后 估算 出 来 的 。 














对 算法 的 分 析 ， 一 种 方法 是 计算 所 有 情况 的 平均 值 ， 这 种 时 间 复 杂 度 的 
计算 方法 称 为 平均 时 间 复 杂 度 。 另 一 种 方法 是 计算 最 坏 情况 下 的 时 间 复 
杂 度 ， 这 种 方法 称 为 最 坏 时 间 复 杂 度 。 一 般 在 没有 特殊 说 明 的 情况 下 ， 
都 是 指 最 坏 时 间 复 杂 上 度 。 














2.12 算法 空间 复杂 度 


我 们 在 写 代 码 时 ， 完 全 可 以 用 空间 来 换取 时 间 ， 比 如 说 ， 要 判断 茶 东 年 
是 不 是 半年 ， 你 可 能 会 花 一 点 心思 写 了 一 个 算法 ， 而 且 由 于 是 一 个 算 

法 ， 也 融 意 味 着 ， 每 次 给 一 个 年 份 ， 都 是 要 通过 计算 得 到 是 否 是 同年 的 
结果 。 还 有 为 一 个 办 法 就 是 ， 事 先 建 立 一 个 有 2050 个 元 素 的 数组 (年 数 
略 比 現実 多 一 点 ) ， 然 后 把 所 有 的 年 份 按 下 标的 数字 对 应 ， 如 果 古 国 

年 ， 此 数组 项 的 值 惑 是 1， 如 条 不 是 值 为 0。 这 样 ， 所 谓 的 判断 东 一 年 是 
全 是 国 年 ， 就 变 成 了 但 找 这 个 数组 的 某 一 项 的 值 是 多 少 的 问题 。 此 时 ， 
我 们 的 运算 是 最 小 化 了 ， 但 是 人 硬盘 上 或 者 内 存 中 需要 存储 这 2050 个 0 和 
1. 














这 是 通过 一 笔 空间 上 的 开销 来 换取 计算 时 间 的 小 技巧 。 到 发 哪 一 个 好 ， 
其 实 要 看 你 用 在 什么 地 方 。 





算法 的 空间 复杂 度 通 过 计算 算法 所 需 的 存储 空间 实现 ， 算 法 空间 复杂 度 
的 计算 公式 记 作 : S(n)=O((n))， 其 中 ，n 为 问题 的 规模 ，f(n) 为 语句 关于 
n 所 占 存储 空间 的 函数 。 


一 般 情 况 下 ， 一 个 程序 在 机 器 上 执行 时 ， 除 了 需要 存储 程序 本 身 的 指 

令 、 和 常数、 变量 和 输入 数据 外 ， 还 需要 存储 对 数据 操作 的 存储 单元 。 知 
输入 数据 所 占 空间 只 取决 于 问题 本 映 ， 和 算法 无 天 ， 这 样 只 需要 分 析 该 
算法 在 实现 时 所 需 的 辅助 单元 即 可 。 若 算法 执行 时 所 需 的 辅助 空间 相对 
于 输入 数据 量 而 言 是 个 常数 ， 则 称 此 算法 为 原 地 工作 ， 空 间 复杂 度 为 

O(1). 














通常 , RAAEN E AR BER Ses TT TAD RK, A 28 TY 3 28 
度 ” 指 空间 需求 。 当 不 用 限定 词 地 使 用 “复杂 上 度 ” 时 ， 通 常 都 是 指 时 间 复 
杂 度 。 显 然 我 们 这 本 书 重 点 要 讲 的 还 是 算法 的 时 间 复 杂 上 度 的 问题 。 














2.13 ”总 结 回顾 


NEI, AF SEIT SSG TA 


我 们 这 一 章 主 要 谈 了 算法 的 一 些 基 本 概念 。 谈 到 了 数据 结构 与 算法 的 关 
系 是 相互 依赖 不 可 分 割 的 。 


算法 的 定义 : 算法 是 解决 特定 问题 求解 步骤 的 描述 ， 在 计算 机 中 为 指令 
的 有 限 序 列 ， 并 且 每 条 指令 表示 一 个 或 多 个 操作 。 








算法 的 特性 ， 有 穷 性 、 确 定性 、 可 行 性 、 输 入 、 输 出 。 


I 





算法 特性 与 算法 设计 容易 混 ， 震 要 对 比 记忆 。 


Be 0 ge TR 
ee 
在 讲解 如 何 用 事前 分 析 估 算 方法 之 前 ， 我 们 先 给 出 了 函数 渐 近 增长 的 定 
Ki 


函数 的 渐 近 增长 : 给 定 两 个 函数 fm 和 g(m， 如 果 存 在 一 个 整数 N， 使 得 
对 于 所 有 的 np>N，f(o) 总 是 比 g(o 大 ， 那 么 ， 我 们 说 fn) 的 增长 渐 近 快 于 
g(n)。 于 是 我 们 可 以 得 出 一 个 结论 ， 判 断 一 个 算法 好 不 好 ， 我 们 只 通过 
少量 的 数据 是 不 能 做 出 准确 判断 的 ， 如 果 我 们 可 以 对 比 算法 的 关键 执行 
次 数 函 数 的 渐 近 增长 性 ， 基 本 就 可 以 分 析出 : 某 个 算法 ， 随 着 n 的 变 
大 ， 它 会 越 来 越 优 于 另 一 算法 ， 或 者 越 来 越 差 于 另 一 算法 。 








然后 给 出 了 算法 时 间 复 杂 度 的 定义 和 推导 大 0 阶 的 步骤 。 


推导 大 O 阶 : 








。 用 常 数 1 取 代 送 行 時 同 中 的 所 有 加 法 常 数 。 
。 在 修改 后 的 运行 次 数 函 数 中 ， 只 保留 最 高 阶 项 。 
。 如 宁 最 局 阶 项 存在 且 不 是 1， 则 去 除 与 这 个 项 相 乘 的 常数 。 








得 到 的 结果 就 是 大 O 阶 。 


通过 这 个 步 又， 我 们 可 以 在 得 到 算法 的 运行 次 数 表 达 式 后 ， 很 快 得 到 它 
的 时 间 复 杂 度 ， 即 大 0 阶 。 同 时 我 也 提醒 了 大 家 ， 其 实 推导 大 0 阶 很 容 
易 ， 但 如 何 得 到 运行 次 数 的 表达 式 却 是 需要 数学 功底 的 。 





接 独 我 们 给 出 了 第 见 的 时 间 复 杂 上 度 所 耗 时 间 的 大 小 排列 : 


0(1)<0(logn)<0(n)<0(nlogn)<0(n2)<0(n?)<0(2")<0(n! )<o(n") 








a 我 们 给 出 了 关于 算法 最 坏 情 况 和 平均 情况 的 概念 ， 以 及 空间 复杂 
度 的 概念 。 


2.14 结尾 Fe ie 


很 多 学 生 ， 学 了 四 年 计算 机 专业 ， 很 多 程序 员 ， 做 了 很 长 时 间 的 编程 工 
作 ， 却 始终 都 弄 不 明白 算法 的 时 间 复 杂 度 的 估算 ， 这 是 很 可 悲 的 一 件 

事 。 因 为 弄 不 清楚 ， 所 以 也 就 从 不 深究 自己 写 的 代码 是 否 效率 低下 ， 是 
不 是 可 以 通过 优化 让 计算 机 更 加 快速 高 效 。 











他 们 通常 的 借口 是 ， 现 在 CPU 越 来 越 快 ， 根 本 不 用 考虑 算法 的 优 务 ， 实 
现 功能 即 可 ， 用 户 感觉 不 到 算法 好 坏 造 成 的 快慢 。 可 事实 真是 这 样 吗 ? 
还 是 让 我 们 用 数据 来 说 话 吧 。 








假设 CPU 在 短 短 几 年 间 ， 速 度 提 高 了 100 倍 ， 这 其 实 已 经 很 夸张 了 。 而 
我 们 的 某 个 算法 本 可 以 写 出 时 间 复 杂 度 是 O(n) 的 程序 ， 却 写 出 了 On) 的 
程序 ， 仅仅 因为 容易 想到 ， 也 容易 写 。 即 在 O(n”) 的 时 间 复杂 度 算法 程 
序 下 ， 速 度 其 实 只 提高 了 10 倍 


BAB 现代 移 山 


AREE 
挖掘 机 控 
推土机 扒 
烈火 药 炸 





图 2-14-1 


希望 大 家 在 今后 的 学 习 中 ， 好 好 利用 算法 分 析 的 工具 ， 改 进 自 己 的 代 
码 ， 让 计算 机 轻松 一 点 ， 这 样 你 就 更 加 胜 人 一 筹 。 


线性 表 : 
零 个 或 多 个 数据 元 素 的 有 限 序列 。 





3.1 开场 日 


各位 同学 , 大 家 好 。 








今天 我 们 要 开始 学 习 数 据 结构 中 最 利用 和 节 简 单 的 一 种 结构 ， 在 介绍 它 
之 前 先 讲 个 例子 。 





我 经 常 下 午 去 幼儿 园 接 送 儿 子 ， 每 次 部 能 在 门口 看 到 老师 带 着 小 朋友 
们 ， 一 个 拉 着 另 一 个 的 衣服 ， 依 次 从 教室 出 来 。 而 且 我 发 现 很 有 规律 的 
和 是， 每 次 他 们 的 次 序 都 是 一 样 。 比 如 我 儿子 排 在 第 5 个 ， 每 次 他 都 是 在 
第 5 个 ， 前 面 同样 是 那个 小 女孩 ， 后 面 一 直 是 那个 小 男孩 。 这 后 让 我 很 
奇怪 ， 为 什么 一 定 要 这 样 ? 


有 一 天 我 束 问 老师 原因 。 她 告诉 我 ， 为 了 保障 小 朋友 的 安全 ， 避 免 漏 挥 
小 朋友 ， 所 以 给 他 们 安排 了 出 门 的 次 序 ， 事 先 规定 好 了 ， 谁 在 谁 的 前 
面 ， 谁 在 谁 的 后 面 。 这 样 养 成 习惯 后 ， 如 果 有 谁 没有 到 位 ， 他 前 面 和 后 
面 的 小 朋友 就 会 主动 报告 老师 ， 茶 人 不 在 。 即 使 以 后 如 果 要 外 出 到 公园 
或 博物 馆 等 情况 下 ， 老 师 也 可 以 很 快 地 清点 人 数 ， 万 一 有 人 走 丢 ， 也 能 
在 最 快 时 间 知 道 ， 及 时 去 寻找 。 





我 一 想 ， 还 真是 这 样 。 小 朋友 们 始终 按照 次 序 排队 做 事 ， 出 意外 的 情况 
就 可 能 会 少 很 多 。 毕 竞 ， 遵 守 秩序 是 文明 的 标志 ， 应 该 从 娃娃 抓 起 。 而 
且 ， 真 要 有 人 丢失 ， 小 孩子 反而 是 最 认真 负责 的 监督 员 。 























再 看 看 门 外 的 这 帮 家 长 们 ， 都 挤 在 大 门口 ， 哪 个 分 得 清 他 们 谁 是 谁 呀 。 
与 小 孩子 们 的 井然 有 序 形成 了 鲜明 的 对 比 。 哎 ， 有 时 大 人 的 所 作 所 为 ， 
其 实 还 不 如 孩子 。 
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3.2 ”线性 表 的 定义 





线性 表 ， 从 名 字 上 你 就 能 感觉 到 ， 是 具有 像 线 一 样 的 性 质 的 表 。 在 广场 
上 ， 有 很 多 人 分 散在 各 处 ， 当 中 有 些 是 小 朋友 ， 可 也 有 很 多 大 人 ， 甚 至 
还 有 不 少 宠物 ， 这 些小 朋友 的 数据 对 于 整个 广场 人 群 来 说 ， 不 能 算是 线 
性 表 的 结构 。 但 像 刚才 提 到 的 那样 ， 一 个 班级 的 小 朋友 ， 一 个 跟着 一 个 
排 痢 队 ， 有 一 个 打头 ， 有 一 个 收尾 ， 当 中 的 小 朋友 每 一 个 都 知道 他 前 面 
一 个 是 谁 ， 他 后 面 一 个 是 谁 ， 这 样 如 同 有 一 根 线 把 他 们 串联 起 来 了 。 台 
可 以 称 之 为 线性 表 。 





RER (List) : 雲 全 或 多 人 数 据 元 素 的 有限 序列 。 


这 里 需要 强调 几 个 关键 的 地 方 。 


首先 它 是 一 个 序列 。 也 就 是 说 ， 元 素 之 间 是 有 顺序 的 ， 有 元 系 存 在 多 
个 ， 则 第 一 个 元 素 无 前 驱 ， 最 后 一 个 元 系 无 后 继 ， 其 他 每 个 元 系 都 有 且 
只 有 一 个 前 驱 和 后 继 。 如 果 一 个 小 朋友 去 拉 两 个 小 朋友 后 面 的 衣服 ， 那 
就 不 可 以 排 成 一 队 了 ;， 同样， 如果 一 个 小 朋友 后 面 的 衣服 ， 被 两 个 甚至 
多 个 小 朋友 拉扯 ， 这 其 实 是 在 打架 ， 而 不 是 有 序 排队 。 








然后 ， 线 性 表 强 调 是 有 限 的 ， 小 朋友 班级 人 数 是 有 限 的 ， 元 系 个 数 当 然 
也 是 有 限 的 。 事实 上 ， 在 计算 机 中 处 理 的 对 象 都 是 有 限 的 ， 那 种 无 限 的 
数列 ， 只 存在 于 数学 的 概念 中 。 


如 采用 数学 语言 来 进行 定义 。 可 如 下 : 


PRR ETUA (Cap. ap ap Aap.» a » We Ha WEF 
ai，ai+1 领 先 于 a;， 称 aj_ 1 是 a 的 直接 前 驱 元 素 ，aj,1 是 a 的 直接 后 继 元 素 。 
当 i=1，2，..……，n-1 时 ，ai 有 且 仅 有 一 个 直接 后 继 ， 当 i=2，3，.…，n 时 ， 
ai 有 且 仅 有 一 个 直接 前 驱 。 如 图 3-2-1 所 示 。 





tto LEE) 


图 3-2-1 


所 以 线性 和 天 元 素 的 个 数 n (nz0) 定义 为 线性 表 的 长 度 ， 当 n=0 时 ， 称 为 


T 





在 非 空 表 中 的 每 个 数据 元 素 都 有 一 个 确定 的 位 置 ， 如 ai 是 第 一 个 数据 元 
素 ，a 是 最 后 一 个 数据 元 素 ，a 是 第 个 数据 元 素 ， 称 为 数据 元 素 a 在 线 
性 表 中 的 位 序 。 








我 现在 说 一 些 数据 集 ， 大 家 来 判断 一 下 是 人 否 是 线性 表 。 





先 来 一 个 大 家 最 感 兴趣 的 ， 一 年 里 的 星座 列表 ， 是 不 是 线性 表 呢 ? 如 图 
3-2-2 所 示 。 
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图 3-2-2 








“Are, 星座 通常 都 走 用 白 羊 座 打 基 , 双 魚 座 収 尾 , 当 中 的 星座 都 有 前 


驱 和 后 继 ， 而 且 一 共 也 只 有 十 二 个 ， 所 以 它 完全 符合 线性 表 的 定义 。 


公司 的 组 织 架 构 ， 总 经 理 管理 几 个 总 监 ， 每 个 总 监管 理 几 个 经 理 ， 每 个 


总 监管 
经 理 都 有 各 目的 下 属 和 员工 。 这 样 的 组 织 架构 是 不 是 线性 关系 呢 ? 


不 是 ， 为 什么 不 是 呢 ? 哦 ， 因 为 每 一 个 元 素 ， 都 有 不 只 一 个 后 继 ， 所 以 
它 不 是 线性 表 。 那 种 让 一 个 总 经 理 只 管 一 个 总 监 ， 一 个 总 监 只 管 一 个 经 
理 ， 一 个 经 理 只 管 一 个 员工 的 公司 ， 俗 称 庶 包公 司 ， 疯 位 设置 等 于 就 是 
在 忽悠 外 人 。 





班级 同学 之 间 的 友谊 关系 ， 是 不 是 线性 关系 ? 哈哈 ， 不 是 ， 因 为 每 个 人 
都 可 以 和 多 个 同学 建 并 友谊， 不 满足 线性 的 定义 。 咽 ? 有 人 说 爱情 关系 
就是 了 。 胡 扯 ， 难 道 每 个 人 都 要 有 一 个 爱 的 人 和 一 个 爱 自己 的 人 ， 而 且 
他 们 还 都 不 可 以 重复 爱 同一 个 人 这 样 的 情况 出 现 ， 最 终 形成 一 个 班级 情 
感人 物 串 联 ? 这 怎么 可 能 ， 也 许 网 络 小 说 里 可 能 出 现 ， 但 现实 中 是 不 可 





班级 同学 的 点 名 册 ， 是 不 是 线性 表 ? 是 ， 这 和 刚才 的 友谊 关系 是 完全 不 
同 了 ， 因 为 它 是 有 限 序 列 ， 也 满足 类 型 相同 的 特点 。 这 个 点 名 肌 (如 表 
3-2-1 所 示 ) 中 ， 每 一 个 元 素 除 学 生 的 学 号 外 ， 还 可 以 有 同学 的 姓名 、 人 性 
别 、 出 生年 月 什么 的 ， 这 其 实 束 是 我 们 之 前 讲 的 数据 项 。 在 较 复 杂 的 线 
性 表 中 ， 一 个 数据 元 素 可 以 由 名 干 个 数据 项 组 成 。 


75 | 姓名 | 性别 出生 年 月 家 庭 地 直 

1 = | 男 3 RRL A208 
2 李 四 | 女 1948 RRS ROR 

3 FR) k | 199412 | 南 大道 789 号 











表 3-2-1 





一 群 同学 排队 买 演唱 会 门票 ， 每 人 限购 一 张 ， 此 时 排队 的 人 群 是 不 是 线 
性 表 ? 是 ， 对 的 。 此 时 来 了 三 个 同学 要 插 当 中 一 个 同学 A 的 队 ， 说 同学 
A 之 前 拿 着 的 三 个 书包 就 是 用 来 占 位 的 ， 书 包 也 算是 在 排队 。 如 果 你 是 
后 面 早已 来 排队 的 同学 ， 你 们 愿 不 愿意 ?肯定 不 愿意 ， 书 包 怎 么 能 算 排 
OO 
AETA: 




















这 里 用 线性 表 的 定义 来 说 ， 是 什么 理由 ? 嗯 ， 因 为 要 相同 类 型 的 数据 ， 
书包 根本 不 算是 人 ， 当 然 排队 无 效 ， 三 个 人 想 不 劳 而 获 ， 自 然 遭 到 大 家 
的 讶 责 。 看 来 大 家 的 线性 表 学 得 都 不 错 。 


3.3 ”线性 表 的 抽象 数据 类 型 


前 面 我 们 已 经 给 了 线性 表 的 定义 ， 现 在 我 们 来 分 析 一 下 ， 线 性 表 应 该 有 
一 些 什么 样 的 操作 呢 ? 


还 是 回 到 刚才 幼儿 园 小 朋友 的 例子 ， 老 师 为 了 让 小 朋友 有 秩序 地 出 入 ， 
所 以 就 考虑 给 他 们 排 一 个 队 ， 并 且 是 长 期 使 用 的 顺序 ， 这 个 考虑 和 安排 
的 过 程 其 实 就 是 一 个 线性 表 的 创建 和 初始 化 过 程 。 


一 开始 没 经 验 ， 把 小 朋友 排 好 队 后 ， 发 现 有 的 高 有 的 敌 ， 队 伍 很 难看 ， 
于 是 就 让 小 朋友 解散 重新 排 一 一 这 是 一 个 线性 表 重 置 为 空 表 的 操作 。 








排 好 了 队 ， 我 们 随时 可 以 叫 出 队伍 茶 一 位 置 的 小 朋友 名 字 及 他 的 具体 情 
况 。 比 如 有 家 长 问 ， 队 伍 里 第 五 个 孩子 ， 怎 么 这 么 调 记 ， 他 叫 什 么 名 字 
呀 ， 老 师 可 以 很 快 告诉 这 位 家 长 ， 这 就 是 封 清 扬 的 儿子 ， 叫 封 云 证 。 我 
在 劳 就 非常 扭捏 ， 看 来 是 我 给 儿子 的 名 字 没 取 好 ， 儿 子 让 班级 “风云 突 
ee 





还 有 什么 呢 ， 有 时 我 们 想 知道 ， 茶 个 小 朋友 ， 比 如 麦兜 是 人 否 是 班 里 的 小 
朋友 ， 老 师 会 告诉 我 说 ， 不 是 ， 麦 兜 在 春田 花花 幼儿 园 里 ， 不 在 我 们 幼 
儿 园 。 这 种 得 找 茶 个 元 素 是 否 存在 的 操作 很 常用 。 














而 后 有 家 长 问 老师 ， 班 里 现在 到 研 有 多 少 个 小 朋友 呀 ， 这 种 获得 线性 表 
长 度 的 问题 也 很 普 裔 。 


显然 ， 对 于 一 个 幼儿 园 来 说 ， 加 入 一 个 新 的 小 朋友 到 队列 中 ， 或 因 茶 个 
小 朋友 生病 ， 需 要 移 除 共 个 位 置 ， 都 是 很 正音 的 情况 。 对 于 一 个 线性 表 
来 说 ， 插 入 数据 和 删除 数据 都 是 必须 的 操作 。 


所 以 ， 线 性 表 的 抽象 数据 类 型 定义 如 下 : 


ADT 线性 表 (List) 
Data 

线性 表 的 数据 对 象 集合 为 {a1，a2，...... , an}， 每 个 元 素 的 类 型 均 为 DataType。 
其 中 ， 除 第 一 个 元 素 ad 外 ， 个 元 素 有 个 直接 前 驱 元 素 ， 

除了 最 后 一 个 元 素 an 外 ， 个 元 素 有 且 只 有 直接 后 继 元 素 。 

数据 元 素 之 间 的 关系 是 一 对 一 的 关系 。 


Operation 
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1 TEDE 初始 化 操作 ， 建 立 一 个 空 的 线性 表 L。 
ListEmpty(L): 若 线性 表 为 空 ， 返 回 true， 否 则 返回 false。 
ClearList(*L): 将 线性 表 清 空 。 

GetElem(L, i, *e): 将 线性 表 L 中 的 第 i 个 位 置 元 素 值 返回 给 e。 
LocateElem(L, e): 在 线性 表 L 中 查找 与 给 定 值 e 相 等 的 元 素 ， 














如 果 碍 找 成 功 ， 返 回 该 元 素 在 表 中 序号 表示 成 功 ; 


仔细 分 析 一 下 这 个 操作 ， 发 现 我 们 只 要 循环 集合 B 中 的 每 个 元 素 ， 判 断 
寿 不 存在 ， 则 插入 到 A 中 即 可 。 思 路 应 该 是 很 
容易 想到 的 。 








/* 将 所 有 的 在 线性 表 Lb 中 但 不 在 La 中 的 数据 元 素 插入 到 La 中 */ 


void > UNIOoNB(LLst La, List Lb) 























int La_len, Lb_len, i; 

/* 声明 与 La 和 Lb 相 同 的 数据 元 素 e */ 
ElemType e; 

/* 求 线性 表 的 长 度 */ 

La_len = ListLength(*La); 
Lb_len = ListLength(Lb); 

Olan Gls — A a) 


{ 











/* 取 Lb 中 第 i 个 数据 元 素 赋 给 e */ 
GetElem(Lb, i, &e); 
/* La 中 不 存在 和 e 相 同数 据 元 素 */ 
if (!LocateElem(*La, e)) 
/* 插入 */ 
ListTnsert(La, ++La_len, e); 














这 里 ， 我 们 对 于 union 操 作 ， 用 到 了 前 面 线性 表 基 本 操作 ListLength、 
GetElem、LocateElem、ListInsert 等 ， 可 见 ， 对 于 复杂 的 个 性 化 的 操 
作 ， 其 实 就 是 把 基本 操作 组 合 起 来 实现 的 。 


注意 一 个 很 容易 混 消 的 地 方 : 当 你 传递 一 个 参数 给 函数 的 时 候 ， 这 个 参 
数 会 不 会 在 函数 内 航 改 动 决定 了 使 用 什么 参数 形式 。 如 果 需 要 航 改 动 ， 
则 需要 传递 指向 这 个 参数 的 指针 ， 如 果 不 用 被 改动 ， 可 以 直接 传递 这 个 





3.4 线性 表 的 顺序 存储 结构 
3.4.1 ”顺序 存储 定义 


说 这 么 多 的 线性 表 ， 我 们 来 看 看 线性 表 的 两 种 物理 结构 的 第 一 种 一 一 顺 
序 存储 结构 。 


线性 表 的 顺序 存储 结构 ， 指 的 是 用 一 段 地 址 连续 的 存储 单元 依次 存储 线 
性 表 的 数 据 元 素 。 


线性 表 〈alaz……an) 的 顺序 存储 示意 图 如 下 : 





图 3-4-1 


我 们 在 第 一 诬 时 已 经 讲 过 顺序 存储 结构 。 今 天 我 再 举 一 个 例子 。 


记得 大 学 时 ， 我 们 同 牡 售 有 一 个 同学 ， 人 特别 老实 、 热 心 ， 我 们 时 第 会 
让 他 帮 我 们 去 图 书馆 占 座 ， 他 总 是 答应 ， 你 想 想 ， 我 们 一 个 宿舍 连 他 共 
有 九 个 人 ， 这 其 实 明摆着 是 欺 儿 人 的 事 。 他 每 次 一 吃 完 早饭 束 冲 去 图 书 
迄 ， 挑 一 个 好 地 儿 ， 把 他 书包 里 的 书 ， 一 本 一 本 地 按 座 位 放 好 ， 知 书包 
里 的 书 不 够 ， 他 会 把 他 的 饭盒 、 水 杯 、 水 笔 都 用 上 ， 长 长 一 排 ， 九 个 座 
便 是 被 他 占 了 ， 后 来 有 一 次 因 占 座 的 事 弄 得 差点 都 要 打架 。 














图 3-4-2 


3.4.2 ”顺序 存储 方式 


线性 表 的 顺序 存储 结构 ， 说 白 了 ， 和 刚才 的 例子 一 样 ， 就 是 在 内 存 中 找 
了 了 块 地 儿 ， 通 过 占 位 的 形式 ， 把 一 定 内 存 空间 给 占 了 ， 然 后 把 相同 数据 
类 型 的 数据 元 素 依次 存放 在 这 块 空地 中 。 既 然 线性 表 的 每 个 数据 元 素 的 
类 型 都 相同 ， 所 以 可 以 用 C 语 言 《 其 他 语言 也 相同 ) 的 一 维 数组 来 实现 
顺序 存储 结构 ， 即 把 第 一 个 数据 元 系 存 到 数组 下 标 为 0 的 位 置 中 ， 接 看 
把 线性 表 相 邻 的 元 际 存 储 在 数组 中 相 邻 的 位 置 。 








我 那 同学 占 座 时 ， 如 果 图 书馆 里 空 座 很 多 ， 他 当然 不 必 一 定 要 选择 第 一 
排 第 一 个 位 子 ， 而 是 可 以 选择 风水 不 错 、 美 女 较 多 的 地 儿 。 找 到 后 ， 放 
一 个 书包 在 第 一 个 位 置 ， 就 表示 从 这 开始 ， 这 地 方 暂时 归 我 了 。 为 了 建 
立 一 个 线性 表 ， 要 在 内 存 中 找 一 块 地 ， 于 是 这 块 地 的 第 一 个 位 置 就 非常 
关键 ， 它 是 存储 空间 的 起 始 位 置 。 


接着 ， 因 为 我 们 一 共 九 个 人 ， 所 以 他 需要 占 九 个 庶 。 线 性 表 中 ， 我 们 佑 
算 这 个 线性 表 的 最 大 存储 容量 ， 建 立 一 个 数组 ， 数 组 的 长 度 就 是 这 个 最 
大 存储 容量 。 











可 现实 中 ， 我 们 宿舍 总 有 那么 几 个 不 是 很 好 学 的 人 ， 为 了 游戏 ， 为 了 恋 
爱 ， 就 不 去 图 书馆 目 习 了 。 假 设 我 们 九 个 人 ， 去 了 六 个 ， 真 正和 被 使 用 的 
座位 也 就 只 是 六 个 ， 男 三 个 是 空 的 。 同 样 的 ， 我 们 已 经 有 了 起 始 的 位 
置 ， 也 有 了 最 大 的 容量 ， 于 是 我 们 可 以 在 里 面 增加 数据 了 。 随 着 数据 的 
插入 ， 我 们 线性 表 的 长 度 开 始 变 大 ， 不 过 线性 表 的 当前 长 度 不 能 超过 存 
储 容量 ， 即 数组 的 长 度 。 想 想 也 是 ， 如 果 我 们 有 十 个 人 ， 只 占 了 九 个 
座 ， 上 自然 是 坐 不 下 的 。 





来 看 线性 表 的 顺序 存储 的 结构 代码 。 


/* 存储 空间 初始 分 配 量 */ 





#define MAXSTZE 20 

/* ELemType 类 型 根据 实际 情况 而 定 ， 这 里 假设 为 int */ 
typedef int ElemType; 

typedef struct 





/* 数组 存储 数据 元 素 ， 最 大 值 为 MAXSIZE */ 
ElemType data[MAXSIZE]; 
/* 线性 表 当 前 长 度 */ 
int length; 
Sd St 




















ZE, BOAT Ac EL TS UY FF ts BP I: 


e Hae 的 起 始 位置 : WeAdata, E AEM Se FE ie Ze TA) 
诸位 置 。 

线性 表 的 最 大 存储 容量 : 数组 长 度 MaxSize。 

线性 表 的 当前 长 度 : length. 


3.4.3 数组 长 度 与 线性 表 长 度 区 别 











注意 哦 ， 这 里 有 两 个 概念 “数组 的 长 度 ” 和 "线性 表 的 长 度 ” 需 要 区 分 一 
下 


数组 的 长 度 是 存放 线性 表 的 存储 空间 的 长 度 ， 存 储 分 配 后 这 个 量 一 般 是 

不 变 的 。 有 个 别 同 学 可 能 会 问 ， 数 组 的 大 小 一 定 不 可 以 变 吗 ? 我 怎么 看 

到 有 书 中 谈 到 可 以 动态 分 配 的 一 维 数组 。 是 的 ， 一 般 高 级 语言 ， 比 如 

EID 不 过 这 会 带 来 性 能 
和 损耗 。 


线性 表 的 长 度 是 线性 表 中 数据 元 素 的 个 数 ， 随 看 线性 表 插 入 和 删除 操作 
的 进行 ， 这 个 量 是 变化 的 。 


在 任意 时 刻 ， 线 性 表 的 长 度 应 该 小 于 等 于 数组 的 长 度 。 


3.4.4 ”地 址 计算 方法 


由 于 我 们 数 数 都 是 从 1 开始 数 的 ， 线 性 表 的 定义 也 不 能 免 俗 ， 起 始 也 是 
1， 可 C 语 言 中 的 数组 却 是 从 0 开始 第 一 个 下 标的 ， 于 是 线性 表 的 第 i 个 元 
素 是 要 存储 在 数组 下 标 为 i-1 的 位 置 ， 即 数据 元 素 的 序号 和 存放 它 的 数组 
下 标 之 间 存 在 对 应 关系 《如 图 3-4-3 所 示 )。 








线性 表 的 当前 长 度 Length 





HAMER MaxSize 


图 3-4-3 








用 数组 存储 顺序 表意 味 厦 要 分 配 固定 长 度 的 数组 空间 ， 由 于 线性 表 中 可 
IEEE 





其 实 ， 内 存 中 的 地 址 ， 就 和 图 书馆 或 电影 院 里 的 座位 一 样 ， 都 是 有 编号 
的 。 存 储 器 中 的 每 个 存储 单元 都 有 自己 的 编写， 这 个 编号 称 为 地 址 。 当 
我 们 占 座 后 ， 占 座 的 第 一 个 位 置 确 定 后 ， 后 面 的 位 置 都 是 可 以 计算 的 。 
试想 一 下 ， 我 是 班级 成 绩 第 五 名 ， 我 后 面 的 10 名 同学 成 绩 名 次 是 多 少 

呢 ?” 当 然 是 6，7，...、15， 因 为 5+1，5+2，...，5+10。 由 于 每 个 数据 元 
素 ， 不 管 它 是 整 型 、 实 型 还 是 字符 型 ， 它 都 是 需要 占用 一 定 的 存储 单元 
空间 的 。 假 设 占用 的 是 c 个 存储 单元 ， 那 么 线性 表 中 第 i+1 个 数据 元 素 的 
存储 位 置 和 第 i 个 数据 元 素 的 存储 位 置 满 足下 列 关 系 “LOC 表示 获得 存 























储 位 置 的 图 数 ) 。 


LOC(ai+1)=LOC(ai )+C 


所 以 对 于 第 i 个 数据 元 素 ai 的 存储 位 置 可 以 由 al 推算 得 出 : 


LOC(ai)=LOC(a1)+(i-1)*c 


从 图 3-4-4 来 理解 : 





图 3-4-4 


通过 这 个 公式 ， 你 可 以 随时 算出 线性 表 中 任意 位 置 的 地 址 ， 不 管 它 是 第 

个 还 是 最 后 一 个 ， 痢 是 相同 的 时 间 。 那 么 我 们 对 每 个 线性 表 位 置 的 存 
入 或 者 取出 数据 ， 对 于 计算 机 来 说 都 是 相等 的 时 间 ， 也 就 是 一 个 常数 ， 

因此 用 我 们 算法 中 学 到 的 时 间 复 杂 上 度 的 概念 来 说 ， 它 的 存 取 时 间 性 能 
O(G)。 我 们 通常 把 具有 这 一 特点 的 存储 结构 称 为 随机 存 取 结 构 。 








3.5 ”顺序 存储 结构 的 插入 与 删除 
3.5.1 ”获得 元 素 操 作 


对 于 线性 表 的 顺序 存储 结构 来 说 ， 如 果 我 们 要 实现 GetElem 操 作 ， 即 将 
线性 表 L 中 的 第 i 个 位 置 元 素 值 返回 ， 其 实 是 非常 简单 的 。 就 程序 而 言 
只 要 的 数值 在 数组 下 标 范围 内 ， 就 是 把 数组 第 1 下 标的 信 返 回 即 可 ， 

来 看 代码 ; 


#define OK 1 

#define ERROR 0 

#define TRUE 1 

#define FALSE 0 

typedef int Status; 

/* Status 是 函数 的 类 型 ， 其 值 是 函数 结果 状态 代 
码 ， 如 OK 等 */ 

/* 初始 条 件 : 顺序 线性 表 L 已 存在 ，1<i< 
ListLength(L) */ 

/* 操作 结果 : 用 e 返 回 L 中 第 i 个 数据 元 素 的 值 */ 

Status GetElem(SqList L, int i, ElemType *e) 












































if (L.length == 0 || i< 41 || 
i > L.length) 
return ERROR; 

*e = L.data[i - 1]; 

return OK; 


b 


注意 这 里 返回 值 类 型 Status 是 一 个 整 型 ， 返 回 OK 代 表 1，ERROR 代 表 
0。 之 后 代码 中 出 现 就 不 再 详 述 。 


3.5.2 ”插入 操作 


刚才 我 们 也 谈 到 ， 这 里 的 时 间 复 杂 上 度 为 0(1)。 我 们 现在 来 考虑 ， 如 果 我 
们 要 实现 ListIn-sert (*L,i,e〉， 即 在 线性 表 L 中 的 第 i 个 位 置 插 入 新 元 素 
e， 应 该 如 何 操 作 ? 


举 个 例子 ， 本 来 我 们 在 春运 时 去 买 火 车 票 ， 大 家 都 排队 排 的 好 好 的 。 这 
时 来 了 一 个 美女 ， 对 着 队伍 中 排 在 第 三 位 的 你 说 , “大 哥 ， 求 求 你 帮 帮 








忙 ， 我 家 母亲 有 病 ， 我 得 急 厦 回去 看 她 ， 这 队伍 这 么 长 ， 你 可 人 否 让 我 排 
在 你 的 前 面 ? ”你 心 一 软 ， 就 同意 了 。 这 时 ， 你 必须 得 退 后 一 步 ， 人 否则 
她 是 没 法 进 到 队伍 来 的 。 这 可 不 得 了 ， 后 面 的 人 像 蠕 虫 一 样 ， 全 部 都 得 
e 5 Fee. (AS A As EU Ee ELS, BOTT ATP 
De 





这 个 例子 其 实 已 经 说 明了 线性 表 的 顺序 存储 结构 ， 在 插入 数据 时 的 实现 
过 程 〈 如 图 3-5-1 所 示 ) 。 
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图 3-5-1 





插入 算法 的 思路 : 


e 如 果 插 入 位 置 不 合理 ， 抛 出 异常 ; 

。 如 果 线 性 表 长 度 大 于 等 于 数组 长 度 ， 则 抛 出 异常 或 动态 增加 容量 ; 

e 从 最 后 一 个 元 素 开始 癌 前 遍历 到 第 i 个 位 置 ， 分 别 将 它们 都 向 后 移 
动 一 个 位 置 ; 

。 将 要 插入 元 素 填 入 位 置 i 处 ; ? 表 长 加 1。 





实现 代码 如 下 : 


/* 初始 条 件 : 顺序 线性 表 L 已 存在 ，1<i< 
ListLength(L), */ 

/* 操作 结果 : 在 L 中 第 i 个 位 置 之 前 插入 新 的 数据 元 
素 e， 上 | 的 长 度 加 1 */ 

Status ListInsert(SqList *L, int i, ElemType e) 

{ 




















int k; 

/* 顺序 线性 表 已 经 满 */ 

if (L->length == MAXSIZE) 
return ERROR; 

/* 当 i 不 在 范围 内 时 */ 

if (i < 1 || i >L->length + 1) 
return ERROR; 

/* 若 插入 数据 位 置 不 在 表 尾 */ 

if (i <= L->length) 






























































/* 将 要 插入 位 置 后 数据 元 素 向 后 移动 一 位 */ 
for (k = L->length - 1; k >= i - 1; k--) 
L->data[k + 1] = L->data[k]; 














} 

/* 将 新 元 素 插 入 */ 
L->data[i - 1] =e; 
L->lLength++; 

return OK; 





应 该 说 这 代码 不 难 理解 。 如 末 是 以 前 学 习 其 他 语言 的 同学 ， 可 以 考虑 把 
它 转 换 成 你 熟悉 的 语言 再 实现 一 志 ， 只 要 思路 相同 就 可 以 了 。 


3.5.3 ”删除 操作 


接着 刚才 的 例子 。 此 时 后 面 排队 的 人 和 群 意见 都 很 大 ， 都 说 怎么 可 以 这 

样 ， 不 管 什么 原因 ， 插 队 就 是 不 行 ， 有 本 事 ， 找 火车 站 开 后 门 去 。 残 在 
这 时 ， 远 处 跑 来 一 胖子 ， 对 者 这 美女 喊 ， 可 找到 你 了 ， 你 这 驴子 ， 还 我 
钱 。 只 见 这 女子 二 话 不 说 ， 突 然 就 冲 出 了 了 队伍， 胖子 妃 在 其 后 ， 消 失 在 
人 群 中 。 哦 ， 原 来 她 是 倒卖 火车 票 的 黄牛 ， 刚 才 还 装 可 怜 。 于 是 排队 的 
人 群 , SURE PE, PRS A, EA, PMS OP 
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XIE R ER AY Ue FF AARRE ( 如 図 3-5-2 所 示 ) 。 
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图 3-5-2 





删除 算法 的 思路 : 


如 果 删 除 位 置 不 合理 ， 抛 出 异常 ; 

取出 删除 元 素 ; 

从 删除 元 素 位 置 开始 遍历 到 最 后 一 个 元 素 位 置 ， 分 别 将 它们 都 向 前 
移动 一 个 位 置 ; 

表 长 减 1。 


实现 代码 如 下 : 


/* 初始 条 件 : 顺序 线性 表 L 已 存在 ，1<i< 
ListLength(L) */ 

/* 操作 结果 : 删除 L 的 第 i 个 数据 元 素 ， He 返上 
其 值 ，L 的 长 度 减 1 */ 

Status ListDelete(SqList *L, int i, ElemType *e) 




































































if (L->length == 0) 

return ERROR; 

/* 删除 位 置 不 正确 */ 

shin (Geena length) 
return ERROR; 

*e = L->data[i - 1]; 

/* 如 果 删 除 不 是 最 后 位 置 */ 

if (i < L->length) 





























/* 将 删除 位 置 后 继 元 素 前 移 */ 
Fon (kK = kK Teno tio KERN 
L->data[k - 1] = L->data[k]; 


} 
L->length--; 
return OK; 


现在 我 们 来 分 析 一 下 ， 插 入 和 删除 的 时 间 复 杂 上 度 。 


先 来 看 最 好 的 情况 ， 如 果 元 素 要 插入 到 最 后 一 个 位 置 ， 或 者 删除 最 后 一 
个 元 系 ， 此 时 时 间 复 杂 度 为 0(1)， 因 为 不 需要 移动 元 素 的 ， 就 如 同 来 了 
一 个 新 人 要 正 币 排队 ， 当 然 是 排 在 最 后 ， 如 果 此 时 他 又 不 想 排 了 ， 那 么 
他 一 个 人 离开 就 好 了 ， 不 影响 任何 人 。 





最 坏 的 情况 呢 ， 如 果 元 系 要 插入 到 第 一 个 位 置 或 者 删除 第 一 个 元 素 ， 此 
时 时 间 复 杂 上 度 是 多 少 呢 ? 那 就 意味 着 要 移动 所 有 的 元 素 问 后 或 者 问 前 ， 
所 以 这 个 时 间 复 杂 度 为 OO)。 











全 于 平均 的 情况 ， 由 于 元 素 插 入 到 第 i 个 位 置 ， 或 删除 第 i 个 元 素 ， 需 要 
移动 n-i 个 元 素 。 根 据 概 率 原 理 ， 每 个 位 置 插入 或 删除 元 素 的 可 能 性 是 相 
同 的 , MREMEN, BINARE, MAE, BINAL. AF 
均 移 动 次 数 和 最 中 间 的 那个 元 系 的 移动 次 数 相等 ， 为 (n-1)/2。 








我 们 前 面 讨论 过 时 间 复 杂 度 的 推导 ， 可 以 得 出 ， 平 均 时 间 复 杂 度 还 是 
O(n). 


这 说 明 什 么 ? 线性 表 的 顺序 存储 结构 ， 在 存 、 读 数据 时 ， 不 管 是 哪个 位 
置 ， 时 间 复 杂 度 都 是 0(1); 而 插入 或 删除 时 ， 时 间 复 杂 度 都 是 O(n)。 这 
就 说 明 ， 它 比较 适合 元 素 个 数 不 太 变化 ， 而 更 多 是 存 取 数据 的 应 用 。 当 
然 ， 它 的 优 缺 点 还 不 只 这 些 .………. 








3.5.4 ”线性 表 顺 序 存 储 结构 的 优 缺 后 


线性 表 的 顺序 存储 结构 的 优 缺 点 如 图 3-5-3 所 示 。 
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图 3-5-3 


好 了 ， 大 家 休 明 一 下 ， 我 们 等 会 儿 接着 讲 力 一 个 存储 结构 。 


3.6 ”线性 表 的 链 式 存储 结构 
3.6.1 ”顺序 存储 结构 不 足 的 解决 办 法 





前 面 我 们 讲 的 线性 表 的 顺序 存储 结构 。 它 是 有 缺点 的 ， 最 大 的 缺点 就 古 
插入 和 删除 时 需要 移动 大 量 元 际 ， 这 显然 驶 需要 耗费 时 间 。 能 不 能 想 办 
法 解决 呢 ? 





要 解决 这 个 问题 ， 我 们 就 得 考虑 一 下 导致 这 个 问题 的 原因 。 





为 什么 当 插 入 和 删除 时 ， 融 要 移动 大 量 元 素 ， 仔 细 分 析 后 ， 发 现 原 因 残 
在 于 相 邻 两 元 系 的 存储 位 置 也 具有 邻居 关系 。 它 们 编写 是 1，2，3， 

.…，n， 它 们 在 内 存 中 的 位 置 也 是 摊 着 的 ， 中 间 没 有 空 际 ， 当 然 束 无 法 
快速 介入 ， 而 删除 后 ， 当 中 融会 留 出 空 除 ， 目 然 需要 弥补 。 问 题 就 出 在 














vy 


这 里 





A 同学 思 路 : 让 当中 每 个 元 系 之 间 都 留 有 一 个 空位 置 ， 这 样 要 插入 时 ， 
就 不 至 于 移动 。 可 一 个 空位 置 如 何 解决 多 个 相同 位 置 插入 数据 的 问题 
呢 ? 所 以 这 个 想法 显然 不 行 。 








B 同 学 思路 : 那 束 让 当中 每 个 元 素 之 间 都 留 足 够 多 的 位 置 ， 根 据 实际 情 
况 制定 空 阶 大 小 ， 比 如 10 人 个， 这样 插入 时 ， 束 不 需要 移动 了 。 万 一 10 个 
空位 用 完了 ， 再 考虑 移动 使 得 每 个 位 置 之 间 都 有 10 个 空位 置 。 如 果 删 

除 ， 就 直接 删 掉 ， 把 位 置 留 空 即 可 。 这 样 似 乎 暂时 解雇 了 插入 和 删除 的 
移动 数据 问题 。 可 这 对 于 超过 10 个 同位 置 数 据 的 插入 ， 效 率 上 还 是 存在 
问题 。 对 于 数据 的 过 历 ， 也 会 因为 空位 置 太 多 而 造成 判断 时 间 上 的 浪 

0 I i 
空位 置 。 














C 同 学 思路 : 我 们 反正 也 是 要 让 相 邻 元 素 间 留 有 足够 余地 ， 那 干脆 所 有 
的 元 系 痢 不 要 考虑 相 邻 位 置 了 ， 哪 有 空位 就 到 哪里 ， 而 只 是 让 每 个 元 素 
知道 它 下 一 个 元 素 的 位 置 在 哪里 ， 这 样 ， 我 们 可 以 在 第 一 个 元 素 时 ， 束 
知道 第 二 个 元 素 的 位 置 (内 存 地 址 )， 而 找到 它 ， 在 第 二 个 元 素 时 ， 青 


找到 第 三 个 元 素 的 位 置 《内 存 地 址 ) 。 这 样 所 有 的 元 素 我 们 就 都 可 以 通 
Wake TT ERB o 


好 ! 太 棒 了 ， 这 个 想法 非常 好 ! C 同 学 ， 你 可 惜 生 晚 了 几 十 年 ， 不 然 ， 
路 。 





3.6.2 ”线性 表 链 式 存 储 结 构 定 义 


在 解释 这 个 思路 之 前 ， 我 们 先 来 谈 男 一 个 话题 。 前 儿 年 ， 有 一 本 书 风靡 
了 全 世界 ， 它 叫 《 达 : 芬 奇 密码 》， 成 为 世界 上 最 畅销 的 小 说 之 一 ， 书 
的 内 容 集 合 了 侦探 、 惊 悚 和 阴谋 论 等 多 种 风格 ， 很 好 看 。 





我 由 于 看 的 时 间 太 过 于 和 久远， 情节 都 筷 记 得 兰 不 多 了 ， 不 过 这 本 书 和 缀 
大 部 分 侦探 小 说 一 样 ， 都 是 同一 种 处 理 办 法 。 那 就 是 ， 作 者 不 会 让 你 事 
先知 道 整个 过 程 的 全 部 ， 而 是 在 一 步 一 步 地 到 达 茶 个 环节 ， 才 根据 现场 
的 信息 ， 获 得 或 推 师 出 下 一 步 是 什么 ， 也 就 是 说 ， 每 一 步 除 了 对 侦破 的 
言 恩 进 一 步 确认 外 《之 前 信息 也 不 一 定 都 是 对 的 ， 有 时 就 是 证 明 东 个 信 
ANEH) ， 还 有 就 是 对 下 一 步 如 何 操作 或 行动 的 指引 。 





不 过 ， 这 个 例子 也 不 完全 与 线性 表 相 符合 。 因 为 案件 侦破 的 线索 可 能 是 
错综复杂 的 ， 有 斥 像 我 们 之 后 要 讲 到 的 树 和 图 的 数据 结构 。 今 天 我 们 要 
谈 的 是 单线 索 ， 无 分 文 的 情况 。 即 线性 表 的 链 式 存储 结构 。 


图 3-6-1 





线性 表 的 链 式 存储 结构 的 特点 是 用 一 组 任意 的 存储 单元 存储 线性 表 的 数 


据 元 率 , IRA AACR EAA, HADEN EAI. OR 
看 , REED Ue A DEA AR Ee i CON3-6-1P1 
示 ) 。 

















以 前 在 顺序 结构 中 ， 每 个 数据 元 系 只 需要 存 数 据 元 素 信息 就 可 以 了 。 现 
站 
HEHE o 





因此 ， 为 了 表示 每 个 数据 元 素 a 
ij 与 其 直接 后 继 数 据 元 素 a 
i+1 之 间 的 逻辑 关系 ， 对 数据 元 素 a 


;来 说 ， 除 了 存储 其 本 身 的 信息 之 外 ， 还 需 存 储 一 个 指示 其 直接 后 继 的 
信息 《〈 即 直接 后 继 的 存储 位 置 ) 。 我 们 把 存储 数据 元 素 信息 的 域 称 为 数 
据 域 ， 把 存储 直接 后 继 位 置 的 域 称 为 指针 域 。 指 针 域 中 存储 的 信息 称 做 
虽 针 或 链 。 这 两 部 分 信息 组 成 数据 元 素 ai 的 存储 映像 ， 称 为 结 点 
(Node) 。 





n 个 结 点 〈ai 的 存储 映像 ) 链 结 成 一 个 链表 ， 即 为 线性 表 (aa。,.…a。) 的 
链 式 存储 结构 ， 因 为 此 链表 的 每 个 结 点 中 只 包含 一 个 指针 域 ， 所 以 叫做 
单 链 表 。 单 链表 正 是 通过 每 个 结 点 的 指针 域 将 线性 表 的 数据 元 素 按 其 逻 
辑 次 序 链 接 在 一 起 ， 如 图 3-6-2 所 示 。 




















图 3-6-2 





对 于 线性 表 来 说 ， 总 得 有 个 头 有 个 尾 ， 链 表 也 不 例外 。 我 们 把 链表 中 第 
一 个 结 点 的 存储 位 置 叫做 头 指 针 ， 那 么 整个 链表 的 存 取 就 必须 是 从 头 指 
针 开 始 进行 了 。 之 后 的 每 一 个 结 点 ， 其 实 就 是 上 一 个 的 后 继 指 针 指 回 的 
位 置 。 想 象 一 下 ， 最 后 一 个 结 点 ， 它 的 指针 指 回 哪 里 ? 





ER 所 以 我 们 规定 ， 线 性 链表 
的 最 后 一 人 和希 点 指針 肪 “ 空 ” (通常 用 NULL 或 “の” 符号 表示 , 如 図 3-6-3 所 
AN) 。 












图 3-6-3 


有 时 ， 我 们 为 了 更 加 方便 地 对 链表 进行 操作 ， 会 在 单 链表 的 第 一 个 结 点 
前 附设 一 个 结 点 ， 称 为 头 结 点 。 头 结 点 的 数据 域 可 以 不 存储 任何 信息 ， 
谁 叫 它 是 第 一 个 呢 ， 有 这 个 特权 。 也 可 以 存储 如 线性 表 的 长 度 等 附加 信 
Kh, 共 策 点 的 指針 域 存 備 指向 第 一 介 希 点 的 指針 , 如 図 3-6-4 所 示 。 
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图 3-6-4 


3.6.3” 头 指针 与 头 结 点 的 异同 


头 指针 与 头 结 点 的 异同 点 ， 如 图 3-6-5 所 示 。 


3.6.4 
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图 3-6-5 


线性 表 链 式 存储 结构 代码 描述 


KEREN REBA -AN 


便 而 设立 的 ， 放 在 第 一元 素 的 
HALI PEE, 
X (也 可 存放 链表 的 长 度 。 
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右 线 性 表 为 空 表 ， 则 头 结 点 的 指针 域 为 “ 空 ”， 如 图 3-6-6 所 示 。 
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图 3-6-6 


这 里 我 们 大 概 地 用 图 示 表达 了 内 存 中 单 链表 的 存储 状态 。 看 着 满 图 的 省 
略 号 <……”， 你 就 知道 是 多 么 不 方便 。 而 我 们 真正 关心 的 它 是 在 内 存 
中 的 实际 位 置 吗 ? 不 是 的 ， 这 只 是 它 所 表示 的 线性 表 中 的 数据 元 素 及 数 
据 元 素 之 间 的 逻辑 关系 。 所 以 我 们 改 用 更 方便 的 存储 示意 图 来 表示 单 链 











表 , 如 図 3-6-7 所 示 。 
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图 3-6-7 


at AKA A BERS, 則 如 図 3-6-8 所 示 。 


头 指针 
nn Elin 


空 链 表 如 图 3-6-9 所 示 。 


图 3-6-8 
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图 3-6-9 
单 链 表 中 ， 我 们 在 C 语 言 中 可 用 结构 指针 来 描述 。 


/* 线性 表 的 单 链表 存储 结构 */ 
typedef struct Node 
{ 





ElemType data; 
struct Node *next; 
} Node; 
/* 定 又 LinkList */ 
typedef struct Node *LinkList; 


从 这 个 结构 定义 中 ， 我 们 也 残 知 道 ， 结 点 由 存放 数据 元 素 的 数据 域 和 存 
放 后 继 结 点 地 址 的 指针 域 组 成 。 假 设 p 是 指向 线性 表 第 i 个 元 系 的 指针 ， 

则 该 结 点 ai 的 数据 域 我 们 可 以 用 p->data 来 表示 ，p->data 的 值 是 一 个 数据 
元 素 ， 结 点 ai 的 指针 域 可 以 用 p->next 来 表示 ，p->next 的 值 是 一 个 指针 。 

p->nextjg IE? 当然 是 指 同 第 it1 个 元 素 ， 即 指 同 ai 的 指针 。 也 就 是 
说 ， 如 果 p->data=a;， 那 么 p->next->data=a;,1 《如 图 3-6-10 所 示 )。 





p->next 


3.7 单 链 表 的 读 取 








在 线性 表 的 顺序 存储 结构 中 ， 我 们 要 计算 任意 一 个 元 素 的 存储 位 置 是 很 
容易 的 。 但 在 单 链表 中 ， 由 于 第 i 个 元 素 到 底 在 哪 ? 没 办 法 一 开始 就 知 
道 ， 必 须 得 从 头 开 始 找 。 因 此 ， 对 于 单 链 表 实 现 获取 第 i 个 元 际 的 数据 
的 操作 GetElem， 在 算法 上 ， 相 对 要 麻烦 一 些 。 


获得 链表 第 i 个 数据 的 算法 思路 : 


1. 声 a 同 牧 表 第 一 條 筐 点 , 初 始 化 j 尺 1 井 始 ; 

束 志 历 链 表 ， 让 p 的 指针 癌 后 移动 ， 不 断 指 疝 下 一 结 点 ，j 累 
1; 

3.47 PERR Ep A Ze, MHBS AAMT E; 

4 AMARA, 返 回 策 点 p 的 数 据 。 








实现 代码 算法 如 下 : 


/* 初 始 条件 顺序 线性 表 L 已 存在 ，1<i< 
ListLength(L) */ 

/* 操作 结果 : 用 e 返 回 L 中 第 i 个 数据 元 素 的 值 */ 

Status GetElem(LinkList L, int i, ElemType *e) 




















1 
int je 
LinkList p; /* 声明 一 指針 p */ 
i = ke >next; he 外 p 指 向 链表 L 的 第 个 结 点 2 


j M OAT | os 
Ves 不 为 空 且 计数 器 j 还 没有 等 于 i 循环 继续 */ 
while (D && j < i) 





p = p->next; /* 让 p 指 向 下 一 个 结 点 */ 
++); 


+ 
if (!p || j > 4) 














return ERROR; /* 第 i 个 结 点 不 存在 */ 
*e = p->data; /* 取 第 i 个 结 点 的 数据 */ 
return OK: 


说 白 了 ， 就 是 从 头 开 始 找 ， 直 到 第 i 企 结 点 为 止 。 由 于 这 个 算法 的 时 间 


RADAR INI, i=l, WARE, 第 一 介 就 取出 数 据 了 , 
而 当 i=n 时 则 壳 历 n-1 次 才 可 以 。 因 此 最 坏 情况 的 时 间 复 杀 上 度 是 DOn)。 








由 于 单 链 表 的 结构 中 没有 定义 表 长 ， 所 以 不 能 事 和 多 知道 要 循环 多 少 次 ， 
因此 也 就 不 方便 使 用 for 来 控制 循环 。 其 主要 核心 思想 就 是 “工作 指针 后 
移 "”， 这 其 实 也 是 很 多 算法 的 第 用 技术 。 








此 时 就 有 人 人 说， 这 么 唉 烦 ， 这 数据 结构 有 什么 意思 ! 还 不 如 顺序 存储 结 
构 呢 。 





哈 ， 世 间 万 物 总 是 两 面 的 ， 有 好 自然 有 不 足 ， 有 差 目 然 束 有 优势 。 下 面 
我 们 来 看 一 下 在 单 链 表 中 的 如 何 实现 “插入 ”和 “删除 ”。 


3.8” 单 链表 的 插入 与 删除 
3.8.1 FERRA 


先 来 看 单 链表 的 插入 。 假 设 存储 元 素 e 的 结 点 为 s， 要 实现 结 点 p、Pp- 
>next 和 s 之 间 逻 辑 关 系 的 变化 ， 只 需 将 结 点 s 插 入 到 结 点 p 和 p->next 之 间 
即 可 。 可 如 何 插 入 昵 〈 如 图 3-8-1 所 示 )? 





图 3-8-1 


根本 用 不 着 惊动 其 他 结 点 ， 只 需要 让 s->next 和 p->next 的 指针 做 一 点 改变 


BI Ay 


s->next = p->next; p->next = s; 


解读 这 两 名 代码 ， 也 就 是 说 让 p 的 后 继 结 点 改 成 s 的 后 继 结 点 ， 再 把 结 点 
s 变 成 p 的 后 继 结 点 〈 如 图 3-8-2 所 示 ) 。 


p p->next 


p—s 





ーー ーー 


/ 
\ 7 
+e |+ 
¢ 
= 


5 


图 3-8-2 


考虑 一 下 ， 这 两 句 的 顺序 可 不 可 以 交换 ? 


如 果 先 p->next=s; 再 s->next=p->next 会 怎么 样 ? 哈哈 ， 因 为 此 时 第 一 句 
会 使 得 将 p->next 给 覆盖 成 sg 的 地 址 了 。 那 么 S->next=p->next， 其 实 就 等 于 
s->next=s， 这 样 真 正 的 拥有 a 


i+1 数 据 元 系 的 结 点 就 没 了 上 级 。 这 样 的 插入 操作 就 是 失败 的 ， 造 成 了 
临场 掉 链 子 的 尴 砍 局 面 。 所 以 这 两 句 古 无 论 如 何不 能 反 的 ， 这 点 初学 者 


一 定 要 注意 。 


插入 结 点 s 后 ， 链 表 如 图 3-8-3 所 示 。 


D s->next 





s tH Ai ze p->next 


图 3-8-3 


对 于 单 链 表 的 表 尖 和 表 尾 的 特殊 情况 ， 操 作 是 相同 的 ， 如 图 3-8-4 所 示 。 
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图 3-8-4 


单 链表 第 i 个 数据 插入 结 点 的 算法 思路 ; 1. 声 明 一 指针 p 指 癌 链表 头 结 
上 点， 初始化 j 从 1 开始 ; 2. 当 j<i 时 ， 束 过 历 链表 ， 让 p 的 指针 问 后 移动 ， 
不断 指向 下 一 和希 点 , j 累 加 1, 3. 知 到 链表 末尾 p 为 空 ， 则 说 明 第 i 企 结 点 
MEE; 4. 人 否则 得 找 成 功 ， 在 系统 中 生成 一 个 空 结 点 $; 5. 将 数据 元 又 e 
赋值 给 s->data; ”6. 单 链表 的 插入 标准 语句 s->next=p->next;p->next=s; 7. 
返回 成 功 。 





实现 代码 算法 如 下 : 





/* 初始 条 件 : 顺序 线性 表 L 已 存在 ，1<i< 
ListLength(L), */ 
/* 操作 结果 :在 L 中 第 i 个 结 点 位 置 之 前 插入 新 的 数 
据 元 素 e，L 的 长 度 加 1 */ 
Status ListInsert(LinkList *L, int i, ElemType e) 
£ 
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ps 


Sl 

/* FRAL-1PE A */ 
while (p && j < i) 
{ 





p = p->next; 


++] ) 


} 
/* 第 i 个 结 点 不 存在 */ 
if ('p II j > 4) 
return ERROR; 
/* 生成 新 结 点 《〈C 标 准 函 数 ) */ 
s = (LnkList )ma11oc(s1zeof(Node ) ); 
s->data = e; 
/* 将 p 的 后 继 结 点 赋值 给 s 的 后 继 */ 
S->next = p->next; 
/* 将 s 赋 值 给 p 的 后 继 */ 
p->next = s; 
return OK; 
































在 这 上 段 算法 代码 中 ， 我 们 用 到 了 C 语 言 的 mal-loc 标 准 函 数 ， 它 的 作用 就 
是 生成 一 个 新 的 结 点 ， 其 类 型 与 Node 是 一 样 的， 其 实质 就 是 在 内 存 中 找 
了 一 小 块 空地 ， 准 备用 来 存放 数据 e 的 s 结 扣 。 





3.8.2 单 链 表 的 删除 


现在 我 们 再 来 看 单 链表 的 删除 。 设 存储 元 系 a 








i 的 结 皮 为 g， 要 实现 将 结 点 q 删 除 单 链表 的 操作 ， 其 实 束 古 将 它 的 前 继 
结 点 的 指针 绕 过 ， 指 向 它 的 后 继 结 皮 即 可 ， 如 图 3-8-5 所 示 。 


GEL Fi Fig->nextil 
Ai Hp p>next  p>next->next 
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图 3-8-5 


我 们 所 要 做 的 ， 实 际 上 束 是 一 步 ，p->next=p->next->next， 用 g 来 取代 p- 
>next, Hild: 


q=p->next; p->next=q->next; 





解读 这 两 名 代码 ， 也 就 是 说 把 p 的 后 继 结 点 改 成 p 的 后 继 的 后 继 结 点 。 有 
点 押 口 呀 ， 那 我 再 打 个 形象 的 比方 。 本 来 是 爸爸 左手 牵 着 妈妈 的 手 ， 碳 
手 达 着 宝宝 的 手 在 马路 边 散 步 。 突 然 迎 面 走 来 一 美女 ， 和 爸爸 一 下 子 看 呆 
了 ， 此 情景 被 妈妈 逮 个 正 着 ， 于 是 她 生气 地 甩 开 牵 着 的 爸爸 的 手 ， 绕 过 
他 ， 扯 开 父 子 俩 ， 拉 起 宝宝 的 左手 就 快 步 朝 前 走 去 。 此 时 妈妈 是 p 结 
点 ， 妈 妈 的 后 继 是 爸爸 p->next， 也 可 以 叫 q 结 点 ， 妈 妈 的 后 继 的 后 继 是 
儿子 p->next->next， 即 qd->next。 当 妈妈 去 牵 儿 子 的 手 时 ， 这 个 爸爸 就 已 
经 与 母子 俩 没有 牵手 联系 了 ， 如 图 3-8-6 所 示 。 











出 


AD p>next  p>next>next 
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图 3-8-6 
单 链 表 第 i 个 数据 删除 结 点 的 算法 思路 : 


1. 声 明 一 指针 p 指 向 链表 头 结 点， 初始 化 j 从 1 开始 ; 
| 
Fa JHI; 

3. 大 到 链表 末尾 p 为 空 ， 则 说 明 第 i 个 结 点 不 存在 ; 

4. 人 否则 碍 找 成功 ， 将 欲 删除 的 结 点 p->next 赋 值 给 q; 

5. 单 链表 的 删除 标准 语句 p->next=q->next; 

6. 将 q 结 点 中 的 数据 赋值 给 eg， 作为 返回 ; 

7. 释 放 q 结 点 ; 

8. 返 回 成功 。 








实现 代码 算法 如 下 : 


/* 初始 条 件 : 顺序 线性 表 L 已 存在 ，1<i< 
ES en gh eS 
/* 操作 结果 : 删除 L 的 第 i 个 结 点 ， je 返回 其 
值 ，L 的 长 度 减 1 */ 
Status ListDelete(LinkList *L, int i, ElemType *e) 
{ 





















































UME ANA 
nk Gist sprang? 
p= *L; 


IPAL; 
/* 遍历 寻找 第 -1 个 结 点 */ 
while (p->next && j < i) 


D = p->next; 
Ftp 

+ 

/* 第 i 个 结 点 不 存在 */ 

if (!(p->next) || j > 1) 
return ERROR; 





q >next; 

/* 将 q 的 后 继 赋 值 给 p 的 后 继 */ 
p->next = q->next,; 

/* 将 q 结 点 中 的 数据 给 e */ 

*e = q->data; 

/* 让 系统 回收 此 结 点 ， 释 放 内 存 */ 
free(q); 

return OK; 














ESL ASH, BCH BY AS Cia A HI EPA frees 的 作 
用 就 是 让 系统 回收 一 个 Node 结 点 ， 释 放 内 存 。 


分 析 一 下 刚才 我 们 讲解 的 单 链表 插入 和 删除 算法 ， 我 们 发 现 ， 它 们 其 实 
都 是 由 两 部 分 组 成 : 第 一 部 分 就 是 过 有 历 碍 找 第 i 个 结 点 ; 第 二 部 分 就 是 
插入 和 删除 结 扣 。 





从 整个 算法 来 说 ， 我 们 很 容易 推导 出 : 它们 的 时 间 复 淋 度 都 是 O(n)。 如 
果 在 我 们 不 知道 第 个 结 点 的 指针 位 置 ， 单 链表 数据 结构 在 插入 和 删除 
操作 上 ， 与 线性 表 的 顺序 存储 结构 是 没有 太 大 优势 的 。 但 如 果 ， 我 们 希 
望 从 第 i 企 位 置 ， 插 入 10 个 结 点 ， 对 于 顺序 存储 结构 意味 着 ， 每 一 次 插 
入 都 需要 移动 n-i 个 结 点 ， 每 次 都 是 O(n)。 而 单 链表 ， 我 们 只 需要 在 第 一 
次 时 ， 找 到 第 i 个 位 置 的 指针 ， 此 时 为 O(n)， 接 下 来 只 是 简单 地 通过 赋值 
移动 指针 而 已 ， 时 间 复 杂 度 都 是 DO(1)。 显 然 ， 对 于 插入 或 删除 数据 越 频 
繁 的 操作 ， 单 链表 的 效率 优势 束 越 是 明显 。 








3.9 单 链 表 的 整 表 创 建 


回顾 一 下 ， 顺 序 存 储 结构 的 创建 ， 其 实 就 是 一 个 数组 的 初始 化 ， 即 声明 
一 个 类 型 和 大 小 的 数组 并 赋值 的 过 程 。 而 罩 链 表 和 顺序 存储 HM AN 
样 ， 它 不 像 顺 序 存储 结构 这 么 集中 ， 它 可 以 很 散 ， 是 一 种 动态 结构 。 对 
于 每 个 链表 来 说 ， 它 所 占用 空间 的 大 小 和 位 置 是 不 需要 预先 分 配 划 定 

的 ， 可 以 根据 系统 的 情况 和 实际 的 需求 即时 生成 。 








所 以 创建 单 链 表 的 过 程 就 是 一 个 动态 生成 链表 的 过 程 。 即 从 “ 空 表 ”的 初 
始 状态 起 ， 依 次 建立 各 元 素 结 点 ， 并 逐个 插入 链表 。 


单 链表 整 表 创 建 的 算法 思路 : 


1. 声 明 一 指针 p 和 计数 器 变量 ii 

2. 初 始 化 一 空 链 表 工 ; 

吉 点 的 指针 指向 NULL， 即 建立 一 个 带头 结 点 的 单 链表 ; 
4. 循 环 


。 生成 一 新 结 点 赋值 给 p; 
。 随机 生成 一 数 子 央 信 给 p 的 数据 减 p->datai 
。 将 p 插 入 到 头 结 点 与 前 一 新 结 点 之 间 。 


实现 代码 算法 如 下 : 











/* 随机 产生 n 个 元 素 的 值 ， 建 立 带 表 头 结 点 的 单 链 
线性 表 L〈 头 播 法 ) */ 


void CreateListHead(LinkList *L, int n) 











Eee p; 


7 "ite ae 
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*L = Sa ee eee en 
/* 先 建立 一 个 带头 结 点 的 单 链表 * 





(*L)->next = NULL; 
Ol (ab RO eal <P ale Stee) 


/* 生成 新 结 点 */ 

p = (LinkList)malloc(sizeof(Node)); 
/* 随机 生成 109 以 内 的 数字 */ 

p->data = rand() % 100 + 工 ; 

p->next = (*L)->next; 

/* 插入 到 表 头 */ 

(*L)->next = p; 








这 段 算 法 代码 里 ， 我 们 其 实用 的 是 插队 的 办 法 ， 就 是 始终 让 新 结 扣 在 第 
一 的 位 置 。 我 也 可 以 把 这 种 算法 简称 为 头 插 法 ， 如 图 3-9-1 所 示 。 





L L->next 
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图 3-9-1 


可 事实 上 ， 我 们 还 是 可 以 不 这 样 干 ， 为 什么 不 把 新 结 点 都 放 到 最 后 呢 ， 
这 才 是 排队 时 的 正常 思维 ， 所 谓 的 移 来 后 到 。 我 们 把 每 次 新 结 点 都 插 在 
终端 结 点 的 后 面 ， 这 种 算法 称 之 为 尾 搬 法 。 


实现 代码 算法 如 下 : 





/* 随机 产生 n 个 元 素 的 值 ， 建 立 带 表 头 结 点 的 单 链 
线性 表 L《〈 尾 插 法 ) */ 
void CreateListTail(LinkList *L, int n) 


{ 














LinkList p,r; 


amt ae 

/* 初始 化 随机 数 种 子 */ 

srand(time(0)); 

/* 为 整个 线性 表 */ 

*L = (LinkList)malloc(sizeof(Node)); 
/* r 为 指向 尾部 的 结 点 */ 








OW Ol 


/* 生成 新 结 点 */ 

p = (Node *)malloc(sizeof(Node)); 
/* 随机 生成 109 以 内 的 数字 */ 

p->data = rand() % 100 + 1; 

/* 将 表 尾 终端 结 点 的 指针 指向 新 结 点 */ 
r->next = p; 
/* 将 当前 的 新 结 点 定义 为 表 尾 终端 结 点 */ 
sn 


} 
/* 表示 当前 链表 结束 */ 
r->next = NULL: 




















注意 L 与 ?的 关系 ，L 是 指 整个 蛙 链 表 ， 而 r 是 指 回 尾 结 反 的 变量 ，r 会 随 
者 循环 不 断 地 变化 结 点 ， 而 L 则 是 随 着 循环 增长 为 一 个 多 结 点 的 链表 。 





这 里 需 解释 一 下 ，r>next=p; 的 意思 ， 其 实 就 是 将 刚才 的 表 尾 终端 结 点 r 
的 指针 指向 新 结 点 p， 如 图 3-9-2 所 示 ， 当 中 全 位 置 的 连 线 就 是 表示 这 个 


局 思 o 


t->next 
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图 3-9-2 


r->next=p; 这 一 句 应 该 还 好 理解 ， 我 以 前 很 多 学 生 不 理解 的 就 是 后 面 这 
一 句 r=p; 是 什么 意思 ? 请 看 图 3-9-3。 


next p 


图 3-9-3 








它 的 意思 ， 就 是 本 来 "是 在 ai1 元 素 的 结 点 ， 可 现在 它 已 经 不 是 最 后 的 结 
点 了 了， 现在 最 后 的 结 点 是 ai， 所 以 应 该 要 让 将 p 结 点 这 个 最 后 的 结 点 赋值 





给 r。 此 时 r 又 是 最 终 的 尾 线 点 了 。 





循环 结束 后 ， 那 么 应 该 让 这 个 节点 的 指针 域 置 空 ， 因 此 有 也- 
>next=NULL;”, 以便 以 后 遍历 时 可 以 确认 其 是 尾部 。 


3.10 单 链 表 的 整 表 删 除 


当 我 们 不 打算 使 用 这 个 单 链表 时 ， 我 们 需要 把 它 销 毁 ， 其 实 也 就 是 在 内 
存 中 将 它 释放 挥 ， 以 便于 留 出 空间 给 其 他 程序 或 软件 使 用 。 


单 链表 整 表 删 除 的 算法 思路 如 下 : 


1. 声 明 一 指針 p 和 aq: 
2. 将 第 一 个 结 点 赋值 给 p; 
3. 循 环 : 


。 将 下 一 结 点 赋值 给 q; 
° 释放 p; 
。 将 q 赋 值 给 p。 


实现 代码 算法 如 下 : 

















/* 初始 条 件 : 顺序 线性 表 L 已 存在 ， 操 作 结 果 : 将 L 
重 置 为 空 表 */ 
Status ClearList(LinkList *L) 


























LinkList p, q; 

/* p 指 向 第 一 个 结 点 */ 
D = (*L)->next; 

/* RIRE */ 
while (p) 

{ 





q = p->next; 
free(p); 
p=q, 


/* 头 结 点 指针 域 为 空 */ 
(*L)->next = NULL; 
return OK; 
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要 。 在 循环 体内 直接 写 free(p); p = p->next; 即 可 。 可 这 样 会 带 来 什么 问 


jel? 





要 知道 p 指 同一 个 结 点 ， 它 除了 有 数据 域 ， 还 有 指针 域 。 你 在 做 free(p); 
时 ， 其 实 是 在 对 它 整个 结 点 进行 删除 和 内 存 释 放 的 工作 。 这 束 好 比 星 党 
快要 病死 了 ， 却 还 没有 册封 太子 ， 他 儿子 五 六 个 ， 你 说 要 是 你 脚 一 跨 倒 
征 解脱 了 ， 这 国家 咋 办 ， 你 那儿 个 儿子 咋 办 ? ARENT E, AAR 
SUB UAT AB SB, 一 定 会 打 起 来 。 所以 不 行 , Sire GES EE, 
得 先 把 遗嘱 写 好 ， 说 清楚 ， 哪 个 儿子 做 太子 才 行 。 而 这 个 遗嘱 就 是 变量 
q 的 作用 ， 它 使 得 下 一 个 结 点 是 谁 得 到 了 记录 ， 以 便于 等 当前 结 皮 释放 
后 ， 把 下 一 结 点 拿 回 来 补充 。 明 白 了 吗 ? 











好 了 ， 说 了 这 么 多 ， 我 们 可 以 来 简单 总 结 一 


3.11 单 链表 结构 与 顺序 存储 结构 优 缺 后 


简单 地 对 单 链 表 结 构 和 顺序 存储 结构 做 对 比 : 


zoug 





* 上 顺序 存 全 结构 有 一段 "Bi 


,顺序 存储 结构 需要 预 分 瑟 
tc Tn GERA, AKT BR. 
ee VAAIA HE 


单元 存放 线性 表 的 元 素 BIRK- 元 素 个 数 也 不 受 限制 
时 间 为 O(n) 
“ 单 链表 在 找 出 革 位 置 的 
指针 后 ， 插 入 和 删除 时 
间 仅 为 (1) 
图 3-11-1 


通过 上 面 的 对 比 ， 我 们 可 以 得 出 一 些 经 验 性 的 结论 : 





各 线性 表 需 要 频繁 得 找 ， 很 少 进行 插入 和 删除 操作 时 ， 宣 采用 顺序 
存储 结构 。 知 需要 频繁 插入 和 删除 时 ， 宣 采用 单 链 表 结 构 。 比 如 说 
游戏 开发 中 ， 对 于 用 户 注册 的 个 人 信息 ， 除 了 注册 时 插入 数据 外 ， 
绝 大 多 数 情况 都 是 读 取 ， 所 以 应 该 考虑 用 顺序 存储 结构 。 而 游戏 中 
的 玩家 的 武器 或 者 装备 列表 ， 随 着 玩家 的 游戏 过 程 中 ， 可 能 会 随时 
增加 或 删除 ， 此 时 再 用 顺序 存储 就 不 太 合 适 了 ， 单 链表 结构 束 可 以 
大 展 伏 脚 。 当 然 ， 这 只 是 简单 的 类 比 ， 现 实 中 的 软件 开发 ， 要 考虑 
的 问题 会 复杂 得 多 。 

当 线性 表 中 的 元 系 个 数 变 化 较 大 或 者 根本 不 知道 有 多 大 时 ， 最 好 用 
单 链表 结构 ， 这 样 可 以 不 需要 考虑 存储 空间 的 大 小 问题 。 而 如 果 事 
先知 道 线性 表 的 大 致 长 度 ， 比 如 一 年 12 个 月 ， 一 周 就 是 星期 一 至 星 
期 日 共 七 天 ， 这 种 用 顺序 存储 结构 效率 会 高 很 多 。 








总 之 ， 线 性 表 的 顺序 存储 结构 和 单 链 表 结 构 各 有 其 优 缺 点 ， 不 能 简单 的 
说 哪个 好 ， 哪 个 不 好 ， 需 要 根据 实际 情况 ， 来 综合 平衡 采用 哪 种 数据 结 
构 更 能 满足 和 达到 需求 和 性 能 。 











休 电 一 下 ， 我 们 再 来 看 看 其 他 的 链表 结构 。 


3.12 静态 链表 











其 实 C 语 言 真是 好 东西 ， 它 具有 的 指针 能 力 ， 使 得 它 可 以 非常 容易 地 操 
作 内 存 中 的 地 址 和 数据 ， 这 比 其 他 高 级 语言 更 加 灵活 方便 。 后 来 的 面 问 
对 象 语言 ， 如 Java、C# 等 ， 昌 不 使 用 指针 ， 但 因为 启用 了 对 象 引 用 机 
制 ， 从 某 种 角度 也 间接 实现 了 指针 的 某 些 作用 。 但 对 于 一 些 语言 ， 如 
Basic、Fortran 等 早期 的 编程 高 级 语言 ， 由 于 没有 指针 ， 链 表 结 构 按 照 前 
面 我 们 的 讲法 ， 它 就 没 法 实现 了 。 怎 么 办 呢 ? 








有 人 束 想 出 来 用 数组 来 代 伙 指针， 来 描述 单 链表 。 真 是 不 得 不 佩服 他 们 
的 智慧 ， 我 们 来 看 看 他 是 怎么 做 到 的 。 








首先 我 们 让 数组 的 元 素 都 是 由 两 个 数据 域 组 成 ，data 和 cur。 也 就 是 说 ， 
数组 的 每 个 下 标 都 对 应 一 个 data 和 一 个 cur。 数 据 域 data， 用 来 存放 数据 
元 素 ， 也 就 是 通常 我 们 要 处 理 的 数据 ; 而 cur 相 当 于 单 链表 中 的 next 指 
针 ， 存 放 该 元 素 的 后 继 在 数组 中 的 下 标 ， 我 们 把 cur 叫 做 游标 。 








我 们 把 这 种 用 数组 描述 的 链表 叫做 静态 链表 ， 这 种 描述 方法 还 有 起 名 叫 
做 游标 实现 法 。 


为 了 我 们 方便 插入 数据 ， 我 们 通常 会 把 数组 建立 得 大 一 些 ， 以 便 有 一 些 
空闲 空间 可 以 便于 插入 时 不 至 于 游 出 。 





/* 线性 表 的 静态 链表 存储 结构 */ 
/* 假设 链表 的 最 大 长 度 是 1000 */ 
#define MAXSIZE 1000 
typedef struct 


ElemType data; 
/* 游标 (Cursor) ， 为 9 时 表示 无 指向 */ 
int cur; 
} Component, 
/* 对 于 不 提供 结构 struct 的 程序 设计 语言 ， 









































可 以 使 用 一 对 并 行 数组 data 和 cur 来 处 理 。 */ 
StaticLinkList [MAXSIZE]; 

















另外 我 们 对 数组 第 一 个 和 最 后 一 个 元 素 作 为 特殊 元 系 处 理 ， 不 存 数 据 。 
我 们 通常 把 未 被 使 用 的 数组 元 又 称 为 备用 链表 。 而 数组 第 一 个 元 素 ， 妈 
下 标 为 0 的 元 素 的 cur 束 存放 备用 链表 的 第 一 个 结 点 的 下 标 ; 而 数组 的 最 
后 一 个 元 系 的 cur 则 存放 第 一 个 有 数值 的 元 素 的 下 标 ， 相当 于 单 链表 中 
的 头 结 点 作用 ， 当 整个 链表 为 空 时 ， 则 为 0。 如 图 3-12-1 所 示 。 


数组 第 一 个 元 系 的 cu 用 来 在 数组 最 后 一 Arae 
放 备 用 链表 第 一 个 结语 的 目标 个 插入 元 素 的 下 村 Margie T 





图 3-12-1 


此 时 的 图 示 相 当 于 初始 化 的 数组 状态 ， 见 下 面 代码 : 























/* 将 维 数组 space 中 各 分 量 链 成 一 备用 链表 ， */ 
/* space[6@] .cur 妨 共 指 針 , "69" 表示 空 指針 */ 
Status InitList(StaticLinkList space) 














ane “aby 

for (i =O; i< ME = Kle alarar) 
space[i]. cur = 

/* 目前 静态 链表 为 空 ， 最 一 个 元 素 的 cur “yf 

SDaCe [MAXSTZE - 1].cur = 0; 

return OK; 














假设 我 们 己 经 将 数据 存 人 评 态 链表 ， 比如 分 别人 存放 
着 * 甲 "、“ 己 ”、“ 丁 ”“ 戊 “已 ”"“ 庚 ”等 数据 ， 则 和 它 将 处 于 如 图 3-12-2 
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cur MInext HIER 
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图 3-12-2 








此 时 “ 甲 * 这 里 就 存 有 下 一 元 素 “ 乙 ”的 游标 2，“ 乙 ” 则 存 有 下 一 元 素 “] ”的 
站 标 3。 而 “ 庚 ” 是 最 后 一 个 有 值 元 素 ， 所 以 它 的 cur 设 置 为 0。 而 最 后 一 个 
D ae 有 值 元 素 而 存 有 它 的 下 标 为 1。 而 第 一 个 元 素 
则 因 空 闲 空 间 的 第 一 个 元 素 下 标 为 7， 所 以 它 的 cur 存 有 7。 














3.12.1 静态 链表 的 插入 操作 


现在 我 们 来 看 看 如 何 实现 元 素 的 插入 。 


静态 链表 中 要 解决 的 是 : 如何 用 静态 模拟 动态 链表 结构 的 存储 空间 的 分 
配 ， 和 需要 时 申请 ， 无 用 时 释放 。 


我 们 前 面 说 过 ， 在 动态 链表 中 ， 结 点 的 申请 和 释放 分 别 借用 mallocO 和 
free() 两 个 函数 来 实现 。 在 静态 链表 中 ， 操 作 的 是 数组 ， 不 存在 像 动态 
链表 的 结 扣 申请 和 释放 问题 ， 所 以 我 们 需要 自己 实现 这 两 个 函数 ， 才 可 
以 做 插入 和 删除 的 操作 。 














为 了 状 明 数组 中 哪些 分 量 未 被 使 用 ， 解 决 的 办 法 是 将 所 有 未 说 使 用 过 的 
及 已 被 删除 的 分 量 用 游标 链 成 一 个 备用 的 链表 ， 每 当 进 行 插 入 时 ， 便 可 
以 从 备用 链表 上 取得 第 一 个 结 反 作 为 待 插 入 的 新 结 点 。 








/* 若 备 用 空间 链表 非 空 ， 则 返回 分 配 的 结 点 下 标 ， 
否则 返回 9 */ 
int Malloc_SLL(StaticLinkList space) 

















© 





/* 当前 数组 第 一 个 元 素 的 cur 存 的 值 ， */ 
/* 就 是 要 返回 的 第 一 个 备用 空闲 的 下 标 */ 
int i = space[9] .cur: 
/* 由 于 要 拿 出 二 个 分 量 来 使 用 了 ， 所 以 我 们 “7 
/* 就 得 把 它 的 下 一 个 分 量 用 来 做 备用 */ 
if (space[0].cur) 

space[0].cur = space[i].cur; 
return i; 


































































































这 段 代 码 有 意思 ， 一 方面 它 的 作用 就 是 返回 一 个 下 标 值 ， 这 个 值 就 是 数 
人 
就 是 返回 7。 





那么 既然 下 标 为 7 的 分 量 准备 要 使 用 了 ， 就 得 有 接 蔡 者 ， 所 以 就 把 分 量 7 
的 cur 值 赋值 给 头 元 素 ， 也 惑 是 把 8 给 space[0].cur， 之 后 加 可 以 继续 分 配 
新 的 空 亲 分 量 ， 实 现 类 似 mallocO 函 数 的 作用 。 





现在 我 们 如 果 需 要 在 “ 乙 ? 和 “本 ”之 间 ， 插 入 一 个 值 为 " 丙 ” 的 元 素 ， 投 照 
以 前 顺序 存储 结构 的 做 法 ， 应 该 要 把 “J”、“ 戊 ”、“ 己 ”、“ 庚 ”这 些 元 素 
都 往 后 移 一 位 。 但 目前 不 需要 ， 因 为 我 们 有 了 新 的 手段 。 





新 元 素 “ 两 "， 想 插队 是 吧 ? 可 以 ， 你 先 悄悄 地 在 队伍 最 后 一 排 第 7 个 游 
标 位 置 待 厦 ， 我 一 会 就 能 帮 你 搞定 。 我 接着 找到 了 “ 乙 ”， 告诉 他 ， 你 的 


cuUr 不 是 游标 为 3 的 ”J 了 ”了 ， 这 点 小 钱 ， 意 思 意 思 ， 你 把 你 的 下 一 位 的 游 
标 改 为 7 就 可 以 了 。“ 乙 ” 叹 了 口气 ， 收 了 钱 把 cur 值 改 了 。 此 时 再 回 

到 “ 丙 ” 屠 里， 说 你 把 你 的 cur 改 为 3。 就 这 样 ， 在 绝 大 多 数 人 都 不 知道 的 
情况 下 ， 整 个 排队 的 次 序 发 生 了 改变 如 图 3-12-3 所 示 )〉。 





实现 代码 如 下 ， 代 码 左 侧 数字 为 行 号 。 





/* 在 L 中 第 ii 个 元 素 之 前 插入 新 的 数据 元 素 e */ 
Status ListInsert(StaticLinkList L, int i, ElemType e) 
{ 
aime ah. ee be 
/* 注意 k 首 先是 最 后 一 个 元 素 的 下 标 */ 
k = MAX_SIZE - 1; 
age (gah co aly |) || St Eengeh ee 
return ERROR; 
/* 获得 空闲 分 量 的 下 标 */ 
j = Malloc_SSL(L); 
本 GD 
/* 将 数据 赋值 给 此 分 量 的 data */ 
L[j].data = e; 
/* 找到 第 i 个 元 素 之 前 的 位 置 */ 
OM (Gl 1) 
k = L[k].cur; 
/* 把 第 i 个 元 素 之 前 的 cur 赋 值 给 新 元 素 的 cur */ 
加 Cue us 
/* 把 新 元 素 的 下 标 赋值 给 第 i 个 元 素 之 前 元 素 的 cur */ 
kcur =F 
return OK; 














































































































return ERROR; 
} 


。 当 我 们 执行 插入 语句 时 ， 我 们 的 目的 是 要 在 “ 乙 ” 和 “ 丁 * 之 间 插 
入 “两 ”。 调 用 代码 时 ， 输 入 i 值 为 3。 

e 第 4 行 让 k=MAX SIZE-1=999。 

e 第 7 行 ，j=Malloc_SSL(L)=7。 此 时 下 标 为 0 的 cur 也 因为 7 要 被 占用 而 
更 改 备用 链表 的 值 为 8。 

e 第 11 一 12 行 ，for 循 环 ] 由 1 到 2， 执 行 两 次 。 代 码 k=L[k].cur; 使 得 
k=999, 得 到 k=L[999].cur=1， 再 得 到 k=L[1].cur=2。 

e 281347, Ljl.cur=L[k].cur: 因 =7, 面 k=2 得 色 L[Z].cur=L[2].cur=3。 
这 就 是 刚才 我 说 的 让 “ 丙 ” 把 它 的 cur 改 为 3 的 意思 。 

。 第 14 行 ，L[k].cur=j; 意 思 就 是 L[2].cur=7。 也 就 是 让 “ 乙 * 得 点 好 处 ， 
把 它 的 cur 改 为 指 癌 “ 丙 ”的 下 标 7。 


就 这 样 ， 我 们 实现 了 在 数组 中 ， 实 现 不 移动 元 素 ， 却 插入 了 数据 的 操作 
ee 





tir 0 1 2 3 4 5 6 7 8 " 9 
図 3-12-3 


3.12.2 ”静态 链表 的 删除 操作 





故事 没完 ， 接 着 ， 排 在 第 一 个 的 甲 突然 接 到 一 电话 ， 看 着 很 急 ， 多 半 不 
古 家 里 有 紧急 情况 ， 就 是 单位 有 突 发 状况， 反正 稍 有 犹豫 之 后 就 急匆匆 
离开 。 这 意味 着 第 一 位 空 出 来 了 ， 那 么 目 然 刚 才 那 个 收 了 好 处 的 乙 就 成 
了 第 一 位 一 一 有 人 走运 起 来 ， 哆 水 都 长 肉 。 

















和 前 面 一 样 ， 删 除 元 系 时 ， 原 来 是 需要 释放 结 点 的 函数 free()。 现 在 我 
们 也 得 自己 实现 它 : 








/* 删除 在 L 中 第 i 个 数据 元 素 e */ 
Status ListDelete(StaticLinkList L, int i) 
í 
aine gy K 
aug (Ca 
return ERROR; 
k = MAX_SIZE - 1; 








7 
1 || i > ListLength(L)) 


TOF (J S ia ae oe) 
k = L[k].cur; 

a) = (ES | ur 

Eiki peuns= glu, 

Free_SSL(L, j); 

return OK; 


有 了 刚才 的 基础 ， 这 有 段 代码 就 很 容易 理解 了 。 前 面 代码 都 一 样 ，for 循 环 
因为 i=1 而 不 操作 ，j=L[999].cur=1，L[k].cur=L[j].cur 也 就 是 
L[999].cur=L[1].cur=2。 这 其 实 束 是 告诉 计算 机 现在 “ 甲 ” 已 经 离开 

I, “CARAT ICH. Free SSL (Lj) ;是 什么 意思 呢 ? KER 

jg: 











/* 将 下 标 为 k 的 空闲 结 点 回收 到 备用 链表 */ 
void Free_SSL(StaticLinkList space, int k) 









































{ 
/* 把 第 一 个 元 素 cur 值 赋 给 要 删除 的 分 量 cur */ 
space[k].cur = Space[9] .Cur: 
/* 把 要 删除 的 分 量 下 标 赋值 给 第 一 个 元 素 的 cur */ 
SDaCe[9].cur = k; 

} 





意思 就 是 “ 甲 ” 现 在 要 走 ， 这 个 位 置 就 空 出 来 了 ， 也 就 是 ， 未 来 如 果 有 新 
人 来 ， 最 优先 考虑 这 里 ， 所 以 原来 的 第 一 个 空位 分 量 ， 即 下 标 是 8 的 分 
量 ， 它 降级 了 ， 把 8 给 “ 甲 ? 所 在 下 标 为 1 的 分 量 的 cur， 也 就 是 
space[1].cur=space[0].cur=8， 而 space[0].cur=k=1 其 实 就 是 让 这 个 删除 的 
位 置 成 为 第 一 个 优先 空位 ， 把 它 存 入 第 一 个 元 素 的 cur 中 ， 如 图 3-12-4 所 
示 。 





了 0 1 2 3 4 5 6 7 8 " 999 





当然 ， 静 态 链 表 也 有 相应 的 其 他 操作 的 相关 实现 。 比 如 我 们 代码 中 的 
ListLength 就 是 一 个 ， 来 看 代码 。 





/* 初 始 条件 : 静态 链表 L 已 存在 。 操 作 结 果 : 返回 L 
中 数据 元 素 个 数 */ 
int ListLength(StaticLinkList L) 














{ 
aljaher ah, SO 
int i = L[MAXSIZE - 1].cur; 
while (i) 
= ur 
jt+t; 
return j; 
} 


男 外 一 些 操作 和 线性 表 的 基本 操作 相同 ， 实 现 上 也 不 复杂 ， 我 们 在 诬告 
上 就 不 讲解 了 。 


3.12.3 ”静态 链表 优 缺 点 


总 结 一 下 静态 链表 的 优 缺 点 〈 见 图 3-12-5) : 


ite 
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图 3-12-5 





上 





"没有 解决 连续 存储 分 配 


带 来 的 表 长 难以 确定 的 
il 
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总 的 来 次 ， 静 态 链 表 其 实 是 为 了 给 没有 指针 的 高 级 语言 设计 的 一 种 实现 
单 链表 能 力 的 方法 。 尽 管 大 家 不 一 定 会 用 得 上 ， 但 这 样 的 思考 方式 是 非 
常 巧妙 的 ， 应 该 理解 其 思想 ， 以 备 不 时 之 需 。 


3.13 ”循环 链表 


在 座 的 各 位 都 很 年 轻 ， 不 会 党 得 日 月 如 梭 。 可 上 了 点 年 纪 的 人 ， 比 如 我 
一 一 的 父 幸 们 ， 就 常常 感慨 ， 要 是 可 以 回 到 从 前 该 多 好 。 网 上 也 盛传 ， 
所 谓 的 成 功 男 人 就 是 3 光 时 不 原 久 子 ，5 岁 能 目 己 吃饭 .……80 岁 能 目 己 史 
仮 , 9027 BEAN DR BET o 











图 3-13-1 


对 于 单 链表 ， 由 于 每 个 结 点 只 存储 了 回 后 的 指针 ， 到 了 尾 标志 就 停止 了 
问 后 链 的 操作 ， 这 样 ， 当 中 茶 一 结 点 束 无 法 找到 它 的 前 驱 结 点 了 ， 就 像 
我 们 刚才 说 的 ， 不 能 回 到 从 前 。 








比如 ， 你 是 一 业务 员 ， 家 在 上 海 。 需 要 经 常 出 关 ， 行 程 就 是 上 海 到 北京 
一 路 上 的 城市 ， 找 客户 谈 生 意 或 分 公司 办 理 业 务 。 你 从 上 海 出 发 ， 乘 火 
车 路 经 多 个 城市 停留 后 ， 再 乘 飞 机 返回 上 海 ， 以 后 ， 每 隔 一 段 时 间 ， 你 
基本 还 要 按照 这 样 的 行程 开展 业务 ， 如 图 3-13-2 所 示 。 


Lk Ee 8 eH RR tt 
neh oe eh hee 
图 3-13-2 


有 一 次 ， 你 先 到 南京 开会 ， 接 下 来 要 对 以 上 的 城市 走 一 过 ， 此 时 有 人 对 
你 资 ， 不 行 ， 你 得 从 上 海 开 始 ， 因 为 上 海 是 第 一 站 。 你 会 对 这 人 说 什 

At 神经 病 。 哪 有 这 么 傻 的 ， 直 接 回 上 海 根 本 没有 必要 ， 你 可 以 从 南京 
开始 ， 下 一 站 昨 埋 ， 直 到 北京 ， 之 后 再 考虑 走 完 上 海 及 苏 南 的 几 个 城 

市 。 显 然 这 表示 你 是 从 当中 一 结 反 开始 届 历 整个 链表 ， 这 都 是 原来 的 单 
链表 结构 解决 不 了 的 问题 。 

















事实 上 ， 把 北京 和 上 海 之 间 连 起 来 ， 形 成 一 个 环 就 解决 了 前 面 所 面临 的 
困难 。 这 就 是 我 们 现在 要 讲 的 循环 链表 。 


将 单 链表 中 终端 结 点 的 指针 端 由 空 指 针 改 为 指 同 头 结 点 ， 束 使 整个 单 链 


表 形 成 一 个 环 ， 这 种 头 尾 相 接 的 单 链 表 称 为 单 循环 链表 ， 简 称 循环 链表 


(circular linked list) 。 


从 刚才 的 例子 ， 可 以 总 结 出 ， 循 环 链表 解决 了 一 个 很 麻烦 的 问题 。 如 何 
从 当中 一 个 结 点 出 发 ， 访 问 到 链表 的 全 部 结 点 。 


为 了 使 空 链 表 与 非 空 链表 处 理 一 致 ， 我 们 通常 设 一 个 头 结 点 ， 当 然 ， 这 
并 不 是 说 ， 循 环 链表 一 定 要 头 结 点 ， 这 需要 注意 。 循 环 链表 带 有 头 结 点 
的 空 链 表 如 图 3-13-3 所 示 : 






KIAT 


图 3-13-3 


对 于 非 空 的 循环 链表 残 如 图 3-13-4 所 示 。 





图 3-13-4 


其 实 循环 链表 和 单 链表 的 主要 差异 就 在 于 循环 的 判断 条 件 上 ， 原 来 是 判 
断 p->next 是 否 为 空 ， 现 在 则 是 p->next 不 等 于 头 结 点 ， 则 循环 未 结束 。 





在 单 链表 中 ， 我 们 有 了 头 结 点 时 ， 我 们 可 以 用 0(1) 的 时 间 访 问 第 一 个 结 
点 ， 但 对 于 要 访问 到 最 后 一 个 结 点 ， 却 需要 On) 时 间 ， 因 为 我 们 需要 将 
单 链表 全 部 扫描 一 过 。 








有 没有 可 能 用 O(1) 的 时 间 由 链表 指针 访问 到 最 后 一 个 结 点 呢 ? 当 然 可 
以 。 


不 过 我 们 需要 改造 一 下 这 个 循环 链表 ， 不 用 头 指 针 ， 而 是 用 指 癌 终端 结 
点 的 尾 指针 来 表示 循环 链表 (如 图 3-13-5 所 示 〉， 此 时 查找 开始 结 点 和 
终端 结 点 都 很 方便 了 。 





图 3-13-5 


从 上 图 中 可 以 看 到 ， 终 端 结 点 用 尾 指针 rear 指 示 ， 则 仁 找 终端 结 点 是 
O(1)， 而 开始 结 点 ， 其 实 就 是 rear->next->next， 其 时 间 复 杂 也 为 0(1)。 


举 个 程序 的 例子 ， 要 将 两 个 循环 链表 合并 成 一 个 表 时 ， 有 了 尾 指针 就 非 
常人 简单 了 。 比 如 下 和 面 的 这 两 个 循环 链表 ， 它 们 的 尾 指针 分 别 是 rearA 和 
rearB， 如 图 3-13-6 所 示 。 





Ly rear 


rearA> next 


WY eH rearB 


rearB-> next rearB-> next> next 





图 3-13-6 


要 想 把 它们 合并 ， 只 需要 如 下 的 操作 即 可 ， 如 图 3-13-7 所 示 。 


P 0 






ーー 
ーー 





rearA-> next 






ーー 


rearB-> next-> next 






图 3-13-7 


/* 保存 A 表 的 头 结 点 ， 即 四 */ 

p = rearA->next: 

/* 将 本 是 指向 B 表 的 第 一 个 结 点 〈 不 是 头 结 点 ) */ 
rearA->next = rearB->next ->next: 

/* 赋值 给 reaA->next， 即 @ */ 

q = rearB->next; 

/* 将 原 A 表 的 头 结 点 赋值 给 rearB->next， 即 @ */ 
rearB->next = D: 

/* 释放 q */ 

free(d): 





3.14 XN fa) HERS 


继续 我 们 刚才 的 例子 ， 你 平时 都 是 从 上 海 一 路 俘 留 到 北京 的 ， 可 是 这 一 
次 , 僚 得 先 到 北京 井 会 , WERE a ABM, Hee. HERE, MR 
需要 例行公事 ， 走 访 各 个 城市 ， 此 时 你 怎么 办 ? 





Lk Ee 8 we eR tt 
[eR Eee bbe se 
图 3-14-1 


有 人 又 出 主意 了 ， 你 可 以 先 飞 回 上 海 ， 一 路 再 乘 火 车 走 明 这 几 个 城市 ， 
到 了 北京 后 ， 你 再 飞 回 上 海 。 


你 会 感慨 ， 人生 中 为 什么 总 会 有 这 样 出 馈 主 意 的 人 存在 昵 ? 真 要 气 死人 
才 行 。 哪 来 这 么 抹 烦 ， 我 一 路 从 北京 坐 火车 或 汽车 回去 不 就 完了 吗 。 


t ee ee eee ge Re UE 
g’e a ae a WM eA : 


图 3-14-2 





对 呀 ， 其 实生 活 中 类 似 的 小 智慧 比比 省 是 ， 并 不 会 那么 的 死板 教条 。 我 
们 的 单 链表 ， 总 是 从 头 到 尾 找 结 点 ， 难 道 束 不 可 以 正 反 表 历 都 可 以 吗 ? 








当然 可 以 ， 只 不 过 需要 加 点 东西 而 已 。 


我 们 在 单 链 表 中 ， 有 了 next 指 针 ， 这 就 使 得 我 们 要 查找 下 一 结 点 的 时 间 
复杂 上 度 为 0(1)。 可 是 如 果 我 们 要 查找 的 是 上 一 结 点 的 话 ， 那 最 坏 的 时 间 
复杂 度 就 是 OO 了， 因为 我 们 每 次 都 要 从 头 开 始 遍 历 查 找 。 








为 了 克服 单 癌 性 这 一 缺点 ， 我 们 的 老 科 学 家 们 ， 设 计 出 了 双 辐 链表 。 双 
向 链表 (double linkedlist) 是 在 单 链 表 的 每 个 结 点 中 ， 再 设置 一 个 指向 
其 前 驱 结 点 的 指针 域 。 所 以 在 双向 链表 中 的 结 点 都 有 两 个 指针 域 ， 一 个 
指向 直接 后 继 ， 另 一 个 指向 直接 前 驱 。 





/* 线性 表 的 双向 链表 存储 结构 */ 
typedef struct DulNode 
{ 





ElemType data; 

struct DuLNode *prior; /* 直接 前 驱 指 针 */ 

struct DuLNode *next; /* 直接 后 继 指 针 */ 
} DulNode, *DuLinkList; 




















既然 单 链表 也 可 以 有 循环 链表 ， 那 么 双 辐 链表 当然 也 可 以 是 循环 表 。 


双向 链表 的 循环 带头 结 点 的 空 链表 如 图 3-14-3 所 示 。 





图 3-14-3 





非 空 的 循环 的 带头 结 点 的 双向 链表 如 图 3-14-4 所 示 。 





ml i at Oat m jal 


图 3-14-4 





由 于 这 是 双 辐 链表 ， 那 么 对 于 链表 中 的 某 一 个 结 点 p， 它 的 后 继 的 前 驱 
EE? 当然 还 是 它 自 己 。 它 的 前 驱 的 后 继 上 自然 也 是 它 自 己 ， 即 : 


p->next->prior = p = p->prior->next 


这 就 如 同上 海 的 下 一 站 是 苏州 ， 那 么 上 海 的 下 一 站 的 前 一 站 是 哪里 ? 哈 
哈 ， 有 点 废话 的 感觉。 


双 同 链表 是 单 链表 中 扩展 出 来 的 结构 ， 所 以 它 的 很 多 操作 是 和 单 链表 相 
同 的 ， 比 如 求 长 度 的 ListLength， 查 找 元 素 的 GetElem， 获 得 元 素 位 置 的 
LocateElem 等 ， 这 些 操作 都 只 要 涉及 一 个 方 回 的 指针 即 可 ， 男 一 指针 多 
了 也 不 能 提供 什么 帮助 。 


就 像 人 生 一 样 ， 想 孚 乐 就 得 先 努 力 ， 欲 收获 就 得 付 代价 。 双 回 链 表 既 然 
是 比 单 链表 多 了 如 可 以 反 辐 过 历 碍 找 等 数据 结构 ， 那 么 也 就 需要 付出 一 
些小 的 代价 : 在 插入 和 删除 时 ， 需 要 更 改 两 个 指针 变量 。 





插入 操作 时 ， 其 实 并 不 复杂 ， 不 过 顺序 很 重要 ， 千 万 不 能 写 反 了 。 





我 们 现在 假设 存储 元 素 e 的 结 点 为 s， 要 实现 将 结 点 s 插 入 到 结 点 p 和 Pp- 
>next 之 间 需 要 下 面 几 步 ， 如 网 3-14-5 所 示 。 








p p- next 





图 3-14-5 











/* 把 p 赋 值 给 s 的 前 驱 ， 如 图 中 四 */ 
s->prior = p; 
/* 把 p->next 赋 值 给 s 的 后 继 ， 如 图 中 @ */ 
S->next = p->next; 
/* 把 s 赋 值 给 p->next 的 前 驱 ， 如 图 中 @) */ 
p->next->prior = s; 
/把 s 赋 值 给 p 的 后 继 ， 如 图 中 四 */ 


p->next = s; 




































































关键 在 于 它们 的 顺序 ， 由 于 第 2 步 和 第 3 步 都 用 到 了 p->next。 如 采 第 4 步 
先 执行 ， 则 会 使 得 p->next 提 前 变 成 了 s， 使 得 插入 的 工作 完 不 成 。 所 以 
我 们 不 妨 把 上 面 这 张 图 在 理解 的 基础 上 记忆 ， 顺 序 是 先 搞定 s 的 前 驱 和 
后 继 ， 再 搞定 后 结 点 的 前 驱 ， 最 后 解决 前 结 点 的 后 继 。 


如 果 插 入 操作 理解 了 ， 那 么 删除 操作 ， 束 比较 简单 了 。 





知 要 删除 结 点 p， 只 需要 下 面 两 步骤 ， 如 图 3-14-6 所 示 。 





图 3-14-6 








/* 把 p->next 赋 值 给 p->prior 的 后 继 ， 如 图 中 GD */ 
p->prior->next = p->next; 
/* 把 p->prior 赋 值 给 p->next 的 前 驱 ， 如 图 中 @ */ 
p->next->prior = p->prior; 

/* 释放 结 点 */ 

free(p); 
































好 了 ， 简单 总 结 一 下 ， 双 辣 链表 相对 了 于 单 链表 来 说 ， 要 更 复杂 一 些 ， 毕 
竟 它 多 了 prior 指 针 ， 对 于 插入 和 删除 时 ， 需 要 格外 小 心 。 另 外 它 由 于 每 
个 结 点 都 需要 记录 两 份 指针 ， 所 以 在 空间 上 是 要 占 用 暗 多 一 些 的 。 不 
T 由 于 它 良 好 的 对 称 性 ， BETA TA n 点 的 前 后 结 点 的 操作 ， 带 来 了 
方便 ， 可 以 有 效 提高 算法 的 时 间 性 能 。 说 白 了 ， 就 是 用 空 x 间 来 换 时 间 。 








3.15 总结 回顾 


这 一 章 ， 我 们 主要 讲 的 是 线性 表 。 








先 谈 了 它 的 定义 ， 线 性 表 是 零 个 或 多 个 具有 相同 类 型 的 数据 元 素 的 有 限 
序列 。 然 后 谈 了 线性 表 的 抽象 数据 类 型 ， 如 它 的 一 些 基 本 操作 。 





之 后 我 们 就 线性 表 的 两 大 结构 做 了 讲述 ， 先 讲 的 是 比较 容易 的 顺序 存储 
结构 ， 指 的 是 用 一 段 地 址 连续 的 存储 单元 依次 存储 线性 表 的 数据 元 素 。 
通常 我 们 都 是 用 数组 来 实现 这 一 结构 。 


后 来 是 我 们 的 重点 ， 由 顺序 存储 结构 的 插入 和 删除 操作 不 方便 ， 引 出 了 
链 式 存储 结构 。 它 具有 不 受 固 定 的 存储 空间 限制 ， 可 以 比较 快捷 的 插入 
和 删除 操作 的 特点 。 然 后 我 们 分 别 束 链 式 存 储 结构 的 不 同形 式 ， 如 单 链 
表 、 循 环 链表 和 双 问 链表 做 了 讲解 ， 男 外 我 们 还 讲 了 厂 不 使 用 指针 如 何 
处 理 链表 结构 的 静态 链表 方法 。 














忆 的 来 说 ， 线 性 表 的 这 两 种 结构 (如 图 3-15-1 所 示 〉 其 实 是 后 面 其 他 数 
据 结构 的 基础 ， 把 它们 学 明白 了 ， 对 后 面 的 学 习 有 着 至 关 重 要 的 作用 。 








WIEK 
MEMAN 人 
HEK HOEK MER TUPLE 


图 3-15-1 


3.16 结尾 语 


知道 为 什么 河 里 钓 起 来 的 鱼 要 比 鱼 塘 里 养 的 鱼 好 吃 吗 ? 因为 鱼 塘 里 的 
fi, KRRAAM, KAROE, Mea AN, ARARA ele 
都 一 样 ， 身 上 鱼肉 不 多 ， 鱼 油 不 少 。 而 河 里 的 鱼 ， 为 了 吃 饱 ， 为 了 避免 
被 更 大 的 鱼 吃 反 ， 它 必须 要 不 断 地 游 。 这 样 生存 下 来 的 鱼 ， 那 鱼肉 吃 起 
KHAA BIR. RO. 














五 六 十 年 代 出 生 的 人 , DA teat ee BOTS RAB 22, SERA il RE 
下 ， 他 们 的 生活 被 社会 安排 好 了 ， 先 科 员 再 科 长 、 后 处 长 再 局 长 ， 混 到 
ARSE; AGE. BL. ARAL; AUN. PRAT. RBH, BH 
NITALE RAE. REPPIN ALT OO TEA RBA, MAAA he 
eee le epee See ces cr 
得 慢 慢 来 。 








可 见 ， 和 舒适 环境 是 很 难 培养 出 坚强 品格 ,被 安排 好 的 人 生 ， 也 很 难 做 出 
伟大 事业 。 


市 场 经 济 社会 下 ， 机 会 就 大 多 了 ， 你 可 以 从 社会 的 任何 一 个 位 置 开始 起 
步 ， 只 要 你 真有 决心 ， 没 有 人 可 以 拦 厦 你 。 事 实 也 证 明 ， 无 论 出 映 是 什 
么 ， 之 前 是 凄 知 还 是 富足 ， 都 有 出 人 头 地 的 一 天 。 当 然 ， 这 也 就 意味 
者 ， 面 临 的 竞争 也 是 空前 激烈 的 ， 一 不 小 必 ， 你 的 位 置 就 可 能 被 人 插 
足 ， 甚 至 你 就 得 out 出 局 。 这 也 多 像 我 们 线性 表 的 链 式 存储 结构 ， 任 何 
位 置 都 可 以 插入 和 删除 。 














不 怕 百 ， 吃 茜 半 幸子 ， 怕 吃 百 ， 吃 茄 一辈子。 如果 你 觉得 上 学 读书 是 受 
罪 , 假设 你 可 以 活 到 80 岁 ， 其 实 你 最 多 也 就 史 了 20 年 苗 。 用 人 生 四 分 之 
一 的 时 间 来 换取 其 余 时 间 的 洱 福 生活 ， 这 扣 百 不 算 喻 。 再 说 了， 跟着 我 
学 习 ， 这 也 能 算是 吃 否 ? 





好 了 , SRAMA, FR 


第 4 章 栈 与 队列 


启示 


栈 与 队列 : 
栈 是 限定 仅 在 表 尾 进行 插入 和 删除 操作 的 线性 表 。 
TN ee 











41 开场 白 


同学 们 ， 大 家 好 ! 我 们 又 见面 了 。 





不 知道 大 家 有 没有 玩 过 手枪 ， 估 计 都 没有 。 现 在 和 和 平年 代 ， 上 哪 去 玩 这 
种 危险 的 真 东 西 ， 就 是 仿真 玩具 也 大 都 被 限制 了 。 我 小 时 候 在 军训 时 ， 
人 
HEIR o 











当时 那个 老兵 告诉 我 们 ， 早先 军官 们 都 爱 用 左轮 手枪 ， 而 非 弹 夹 式 手 
枪 ， 问 我 们 为 什么 ， 我 们 谁 也 说 不 上 来 。 现 在 我 要 问 问 你 们 ， 知 道 为 什 
AMG? (下面 一 受注 然 ) 


哈 ， 我 听 到 下 面 有 同学 说 是 因为 左轮 手枪 好 看 ， 酷 呀 。 嘿 ， 当 然 不 是 这 
个 原因 。 算 了 ， 估 计 你 们 也 很 难 狂 得 到 。 他 那 时 告诉 我 们 说 ， 因 为 子弹 
质量 不 过 关 ， 有 个 别 可 能 是 喘 弹 一 一 也 就 是 有 问题 ”的 、 打 不 出 来 的 子 
弹 。 弹 夹 式 手枪 (如 图 4-1-1 所 示 )〉 ， 如 果 当 中 有 一 颗 是 卡 住 了 的 具 弹 ， 
那么 后 面 的 子弹 就 都 打 不 了 了 。 想 想 看 ， 在 你 准备 用 枪 的 时 候 ， 那 基本 
到 了 不 是 你 死 就 是 我 亡 的 时 刻 ， 突 然 这 手枪 明明 有 子弹 却 打 不 出 来 ， 这 
不 是 要 命 吗 ? 而 左轮 手枪 就 不 存在 这 问题 ， 这 一 颗 不 行 ， 转 到 下 一 颗 就 
可 以 了 ， 人 总 不 会 倒霉 到 六 颗 全 是 具 弹 。 当 然 ， 后 来 子弹 质量 基本 过 关 
了 ， 由 于 弹 夹 可 以 放 8 颗 甚至 20 颗 子弹 ， 比 左轮 手枪 的 只 能 放 6 颗 子弹 要 
多 ， 所 以 后 来 普及 率 更 高 的 还 是 弹 夹 式 的 手枪 。 




















图 4-1-1 


哦 ， 原 来 如 此 。 我 当时 目 认 为 聪明 的 说 道 : 那 很 好 办 呀 ， 这 弹 夹 不 是 先 
放 进 去 的 子弹 ， 最 后 才 可 以 打出 来 吗 ? 你 可 以 把 具 弹 最 移 放 进 去 ， 好 子 
弹 留 在 后 面 ， 这 样 就 不 会 影响 了 呀 。 





WA SE, AE, WREKE — Abe ROE TS, Satay 
Te (大 家 大 笑 ) 





IM, REK- AMEA REKK. 


4.2 REX 
42.1 栈 的 定义 





好 了 ， 说 这 个 例子 目的 不 是 要 告诉 你 们 我 当年 有 多 条 ， 而 是 为 了 引出 今 
天 的 主题 ， 就 是 类 似 弹 夹 中 的 子弹 一 样 先进 去 ， 却 要 后 出 来 ， 而 后 进 
的 ， 反 而 可 以 移出 来 的 数据 结构 一 一 栈 。 











在 我 们 软件 应 用 中 ， 栈 这 种 后 进 先 出 数据 结构 的 应 用 是 非常 普 过 的 。 比 
如 你 用 浏览 右上 网 时 ， 不 管 什 么 浏览 句 都 有 一 个 “后 退 ? 键 ， 你 点 击 后 可 
以 按 访 问 顺序 的 逆序 加 载 浏览 过 的 网 页 。 比 如 你 本 来 看 着 新 闻 好 好 的 ， 
突然 看 到 一 个 链接 说 ， 有 个 可 以 让 你 年 薪 100 万 的 工作 ， 你 暑 不 犹豫 点 
击 它 ， 跳 转 进去 一 看 ， 这 部 是 喻 蚜 ， 具 体内 容 我 也 就 不 说 了 ， 骗 人 骗 得 
一 点 水 平 都 没有 。 此 时 你 还 想 回去 继续 看 新 闻 ， 就 可 以 点 击 左上 角 的 后 
退 键 。 即 使 你 从 一 个 网 页 开始 ， 连 续 点 了 几 十 个 链接 跳 转 ， 你 点 “后 
人 
4-2-1} AN o 








Æ Google - Windows Internet Explorer 
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图 4-2-1 


很 多 类 似 的 软件 ， 比 如 Word、Photoshop 等 文档 或 图 像 编辑 软件 中 ， 都 
有 撤销 (undo) 的 操作 ， 也 是 用 栈 这 种 方式 来 实现 的 ， 当 然 不 同 的 软件 
具体 实现 代码 会 有 很 大 差异 ， 不 过 原理 其 实 都 是 一 样 的 。 

















栈 〈stack) 是 限定 仅 在 表 尾 进行 插入 和 删除 操作 的 线性 表 。 


我 们 把 允许 插入 和 删除 的 一 端 称 为 栈 顶 (top) ， 另 一 端 称 为 栈 底 
(bottom) ， 不 含 任 何 数据 元 素 的 栈 称 为 空 栈 。 栈 又 称 为 后 进 先 出 
(LastIn First Out) 的 线性 表 ， 简 称 LIFO 结 构 。 


理解 栈 的 定义 需要 注意 : 


首先 它 是 一 个 线性 表 ， 也 就 是 说 ， 栈 元 素 具 有 线性 关系 ， 即 前 驱 后 继 关 
系 。 只 不 过 它 是 一 种 特殊 的 线性 表 而 已 。 定 义 中 说 是 在 线性 表 的 表 尾 进 
行 插入 和 删除 操作 ， 这 里 表 尾 是 指 栈 项 ， 而 不 古 栈 的。 





它 的 特殊 之 处 就 在 于 限制 了 这 个 线性 表 的 插入 和 删除 位 置 ， 它 始终 只 在 
栈 顶 进行 。 这 也 就 使 得 : 栈 撒 是 固定 的 ， 最 先进 栈 的 只 能 在 栈 撒 。 


EO 
2-2 所 示 。 


栈 的 删除 操作 ， 叫 作出 栈 ， 也 有 的 叫 作 弹 栈 。 如 同 弹 夹 中 的 子弹 出 夹 ， 
如 图 4-2-3 所 示 。 





图 4-2-2 
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图 4-2-3 


4.2.2” 进 栈 出 栈 变化 形式 











现在 我 要 问 问 大 家 ， 这 个 最 先进 栈 的 元 素 ， 是 不 是 就 只 能 是 最 后 出 栈 
We? 





答案 是 不 一 定 ， 要 看 什么 情况 。 栈 对 线性 表 的 插入 和 删除 的 位 置 进行 了 
限制 ， 并 没有 对 元 素 进 出 的 时 间 进 行 限 制 ， 也 就 是 说 ， 在 不 是 所 有 元 素 
事先 进去 的 元 系 也 可 以 出 栈 ， 只 要 保证 是 栈 顶 元 素 出 
Zo AY BA o 





举例 来 说 ， 如 果 我 们 现在 是 有 3 个 整 型 数字 元 素 1、2、3 依 次 进 栈 ， 会 有 
哪些 出 栈 次 序 呢 ? 


第 一 种 : 1、2、3 进 ， 再 3、2、1 出 。 这 是 最 简单 的 最 好 理解 的 一 
种 ， 出 栈 次 序 为 321。 

第 二 种 : 1 进 ，1 出 ，2 进 ，2 出 ，3 进 ，3 出 。 也 就 是 进 一 个 就 出 一 
个 IRRITA. 

e 第 三 种 : 1 进 ，2 进 ，2 出 ，1 出 ，3 进 ，3 出 。 出 栈 次 序 为 213。 

e 第 四 种 : 1 进 ，1 出 ，2 进 ，3 进 ，3 出 ，2 出 。 出 栈 次 序 为 132。 

e 第 五 种 : 1 进 ，2 进 ，2 出 ，3 进 ，3 出 ，1 出 。 出 栈 次 序 为 231。 





有 没有 可 能 是 312 这 样 的 次 序 出 栈 昵 ?答案 是 肯定 不 会 。 因 为 3 先 出 栈 ， 
就 意味 着 ，3 曾 经 进 栈 ， 既 然 3 都 进 栈 了 ， 那 也 就 意味 着 ，1 和 2 已 经 进 栈 
了 ， 此 时 ，2 一 定 是 在 1 的 上 面 ， 就 是 更 接近 栈 顶 ， 那 么 出 栈 只 可 能 是 

不 然 不 满足 123 依 次 进 栈 的 要 求 ， 所 以 此 时 不 会 发 生 1 比 2 先 出 栈 的 





从 这 个 简单 的 例子 就 能 看 出 ， 只 是 3 个 元 素 ， 就 有 5 种 可 能 的 出 栈 次 序 ， 
ea FES PRAISE AG SBE Eo KA Fe BE 


4.3 栈 的 抽象 数据 类 型 


对 于 栈 来 讲 ， 理 论 上 线性 表 的 操作 特性 它 剖 具备 ， 可 由 于 它 的 特殊 性 ， 
所 以 针对 它 在 操作 上 会 有 些 变化 。 特 别 是 插入 和 删除 操作 ， 我 们 改名 为 
push 和 pop， 英 文 直译 的 话 是 压 和 弹 ， 更 容易 理解 。 你 就 把 它 当 成 是 弹 
夹 的 子弹 压 入 和 弹出 就 好 记忆 了 ， 我 们 一 般 叫 进 栈 和 出 栈 。 





ADT 栈 (stack) 






























































































































































Data 
同 线性 表 。 元 素 具 有 相同 的 类 型 ， 相 邻 元 素 具 有 前 驱 和 后 继 关 系 。 

Operation 
InitStack(*S): 初始 化 操作 ， 建 立 一 个 空 栈 S。 
DestroyStack(*S): 若 栈 存在 ， 则 销毁 它 。 
ClearStack(*S): ”将 栈 清空 。 
StackEmpty(S): AMAZE, 返 回 true, oe ee 
GetTop(S, *e): 若 栈 存 在 且 非 空 ， 用 e 返 回 S 的 栈 顶 元 
Push(*S, e): 若 栈 S 存 在 ， ge ee 
Pop(*S, *e): 删除 栈 S 中 栈 项 元 素 ， 并 用 e 返 回 其 值 。 
StackLength(S): ， 返回 栈 S 的 元 素 个 数 ， 

endADT 


由 于 栈 本 吴 就 是 一 个 线性 表 ， 那 么 上 一 章 我 们 讨论 了 线性 表 的 顺序 存储 
和 和 链 式 存储 ， 对 于 栈 来 说 ， 也 是 同样 适用 的 。 


AA 栈 的 顺序 存储 结构 及 实现 
AAA 栈 的 顺序 存储 结构 


既然 栈 是 线性 表 的 特例 ， 那 么 栈 的 顺序 存储 其 实 也 是 线性 表 顺 序 存储 的 

简化 ， 我 们 简称 为 顺序 栈 。 线 性 表 是 用 数组 来 实现 的 ， 想 想 看 ， 对 于 栈 

RPE SHA IDR ZO BL, PAL FAB 
交 好 ? 








对 ， 没 错 ， 下 标 为 0 的 一 端 作为 栈 抵 比 较 好 ， 因 为 首 元 素 部 存在 栈 底 ， 
变化 最 小 ， 所 以 让 它 作 栈 撒 。 





我 们 定义 一 个 top 变 量 来 指示 栈 顶 元 素 在 数组 中 的 位 置 ， 这 top 就 如 同 中 

学 物理 学 过 的 游标 卡尺 的 游标 ， 如 图 4-4-1， 它 可 以 来 回 和 移动， 意味 着 栈 
顶 的 top 可 以 变 大 变 小 ， 但 无 论 如 何 游 标 不 能 超出 尺 的 长 度 。 同 理 ， 知 

存储 栈 的 长 度 为 StackSize， 则 栈 顶 位 置 top 必 须 小 于 StackSize。 当 栈 存 在 
一 个 元 素 时 ，top 等 于 0， 因 此 通常 把 空 栈 的 判定 条 件 定 为 top 等 于 -1。 
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图 4-4-1 


来 看 栈 的 结构 定义 




















/* SElemType 类 型 根据 实际 情况 而 定 ， 这 里 假设 为 jnt */ 
typedef int SElemType; 

typedef struct 

{ 


SElemType data[MAXSIZE]; 
/* 用 于 栈 顶 指针 */ 
int tops 

}SqStack; 




















AUER TB, StackSizexeS, VRB TEL. FRARI E 
空 栈 和 栈 满 的 情况 示意 图 如 图 4-4-2 所 示 。 
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图 4-4-2 


4.4.2 ” 栈 的 顺序 存储 结构 一 一 进 栈 操作 





对 于 栈 的 插入 ， 即 进 栈 操作 ， 其 实 就 是 做 了 如 图 4-4-3 所 示 的 处 理 。 





イー TAGER 
图 4-4-3 


因此 对 于 进 栈 操作 push， 其 代码 如 下 : 


/* 插入 元 素 e 为 新 的 栈 顶 元 素 */ 
Status Push(SqStack *S, SElemType e) 
{ 


/* Bali */ 
if (S->top == MAXSIZE - 1) 


return ERROR: 


} 
/* 検 項 指針 増加 一 */ 
S->toptt; 
/* 将 新 插入 元 素 赋值 给 栈 顶 空间 */ 
S->data[S->top] = e; 
return OK; 
} 


4.4.3 ” 栈 的 顺序 存储 结构 




















出 栈 
操作 


出 栈 操 作 pop， 代 码 如 下 : 

















/* 若 栈 不 空 ， 则 删除 S 的 栈 顶 元 素 ， 用 e 返 回 其 值 ， 
并 返回 OK; 否则 返回 ERROR */ 
Status Pop(SqStack *S, SElemType *e) 























if (S->top == -1) 
return ERROR: 
/* 将 要 删除 的 栈 顶 元 素 赋值 给 e */ 
*e = S->data[S->top]; 
/* 栈 顶 指针 减 一 */ 
S->top--; 
return OK; 








两 者 没有 涉及 到 任何 循环 语句 ， 因 此 时 间 复 杂 撤 均 是 O(1)。 





其 实 栈 的 顺序 存储 还 是 很 方便 的 ， 因 为 它 只 准 栈 顶 进出 元 素 ， 所 以 不 存 
在 线性 表 插 入 和 删除 时 需要 移动 元 素 的 问题 。 不 过 它 有 一 个 很 大 的 缺 
陷 ， 融 是 必须 事先 确定 数组 存储 空间 大 小 ， 万 一 不够 用 了 ， 融 需要 编程 
手段 来 扩展 数组 的 容量 ， 非 常 麻烦 。 对 于 一 个 栈 ， 我 们 也 只 能 尽量 考虑 
周全 ， 设 计 出 合适 大 小 的 数组 来 处 理 ， 但 对 于 两 个 相同 类 型 的 栈 ， 我 们 
却 可 以 做 到 最 大 限度 地 利用 其 事先 开辟 的 存储 空间 来 进行 操作 。 











打 个 比方 ， 两 个 大 学 室友 毕业 同时 到 北京 工作 ， 开 始 时 ， 他 们 觉得 住 了 
这 么 多 年 学 校 的 集体 宿舍 ， 现 在 工作 了 一 定 要 有 自己 的 私密 空间 。 于 是 
他 们 都 希望 租房 时 能 找到 独 住 的 一 居室 ， 可 找 来 找 去 却 发 现 ， 最 便宜 的 
一 居室 也 要 每 月 1500 元 ， 地 段 还 不 好 ， 实 在 是 承受 不 起 ， 最 终 他 俩 还 是 
将 租 了 一 套 两 居室 ;一共 2000 元 各 出 汪 举 还 不 错 : 











对 于 两 个 一 居室 ， 都 有 独立 的 卫生 间 和 厨 房 ， 是 私密 了 ， 但 大 部 分 空间 
的 利用 率 却 不 高 。 而 两 居室， 两 个 人 各 有 卧室 ， 还 共 诗 了 客厅 、 厨 房 和 
了 卫生间， 房间 的 利用 率 就 显著 提高 ， 而 且 租 房 成 本 也 大 大 下 降 了 。 

















同样 的 道理 ， 如 果 我 们 有 两 个 相同 类 型 的 栈 ， 我 们 为 它们 各 上 自 开 尽 了 数 
组 空间 ， 极 有 可 能 是 第 一 个 栈 已 经 满 了 ， 再 进 栈 就 溢出 了 ， 而 为 一 个 栈 
还 有 很 多 存储 空间 空 亲 。 这 又 何必 呢 ? 我 们 完全 可 以 用 一 个 数组 来 存储 
两 个 栈 ， 只 不 过 需要 反 小 技巧 。 











我 们 的 做 法 如 图 4-5-1， 数 组 有 两 个 端点 ， 两 个 栈 有 两 个 栈 感 ， 让 一 个 栈 
的 栈 抵 为 数组 的 始 端 ， 即 下 标 为 0 处 ， 另 一 个 栈 为 数组 的 末端 ， 即 下 标 
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lopl 











图 4-5-1 





其 实 关键 思路 是 : 它们 是 在 数组 的 两 端 ， 问 中 间 人 靠拢 。top1 和 top2 是 栈 1 
人 可 以 想象 ， 只 要 它们 俩 不 见面 ， 两 个 栈 就 可 以 一 直 
用 。 


从 这 里 也 束 可 以 分 析出 来 ， 栈 1 为 空 时 ， 就 是 top1 等 于 -1 时 ; 而 当 top2 等 
于 n 时 ， 即 是 栈 2 为 空 时 ， 那 什么 时 候 栈 满 呢 ? 





想 想 极端 的 情况 ， 奎 栈 2 是 空 栈 ， 栈 1 的 top1 等 于 n-1 时 ， 就 是 栈 1 满 了 。 
反之 ， 当 栈 1 为 空 栈 时 ，top2 等 于 0 时 ， 为 栈 2 满 。 但 更 多 的 情况 ， 其 实 
就 是 我 刚才 说 的 ， 两 个 栈 见 面 之 时 ， 也 融 是 两 个 指针 之 间 相 差 1 时 ， 即 
top1+1==top2 为 栈 满 。 





两 栈 共享 空间 的 结构 的 代码 如 下 : 


























/* 两 栈 共享 空间 结构 */ 
typedef struct 
{ 





SElemType data[MAXSTZE] / 

int top1: /* 栈 1 栈 项 指针 */ 

int top2; /* 栈 2 栈 顶 指针 */ 
} SqDoubleStack; 


对 于 两 栈 共享 空间 的 push 方 法 ， 我 们 除了 要 插入 元 系 值 参数 外 ， 还 需要 
有 一 个 判断 是 栈 1 还 是 栈 2 的 栈 号 参数 stackNumber。 插 入 元 素 的 代码 如 
F: 








/* 插入 元 素 e 为 新 的 栈 顶 元 素 */ 
Status Push(SqDoubleStack *S, SElemType e, 
int stackNumber ) 








/* ROW. 不能 再 push 新 元素 了 */ 

if (S->top1 + 1 == S->top2) 
return ERROR; 

/* 栈 1 有 元 素 进 栈 */ 

if (stackNumber == 1) 
/* 若 栈 1 则 先 top1+1 后 给 数组 元 素 赋 值 */ 
S->data[++S->top1] = e; 

/* 栈 2 有 元 素 进 栈 */ 

else if (stackNumber == 2) 
/* 若 栈 2 则 先 top2-1 后 给 数组 元 素 赋值 */ 
S->data[--S->top2] = e; 

return OK; 















































KATE OA Sea A Baa Tol, 所 以 后 面 的 top1+1 或 top2-1 
是 不 担心 溢出 问题 的 。 


对 于 两 栈 共 享 空 间 的 pop 方 法 ， 参 数 就 只 是 判断 栈 1 栈 2 的 参数 
stackNumber， 代 码 如 下 : 














/* 若 栈 不 空 ， 则 删除 S 的 栈 顶 元 素 ， 用 e 返 回 其 值 ， 

并 返回 OK; 否则 返回 ERROR */ 
Status Pop(SqDoubleStack *S, SElemType *e, int stackNumber) 
{ 























if (stackNumber == 1) 


/* 说 明 栈 1 已 经 是 空 栈 ， 溢 出 */ 
if (S->top1 == -1) 
return ERROR: 
/* 将 栈 1 的 栈 顶 元 素 出 栈 */ 
*e = S->data[S->top1--]; 





else if (stackNumber == 2) 


/* 说 明 栈 2 已 经 是 空 栈 ， 溢 出 */ 

if (S->top2 == MAXSIZE) 
return ERROR; 

/* 将 栈 2 的 栈 顶 元 素 出 栈 */ 

*e = S->data[S->top2++]; 





return OK; 


事实 上 ， 使 用 这 样 的 数据 结构 ， 通 党 都 是 当 两 个 栈 的 空间 需求 有 相反 关 
系 时 ， 也 残 是 一 个 栈 增长 时 男 一 个 栈 在 缩短 的 情况 。 束 像 买 卖 股票 一 

样 ， 你 买 入 时 ， 一 定 是 有 一 个 你 不 知道 的 人 在 做 卖 出 操作 。 有 人 赚钱 ， 
就 一 定 是 有 人 赔钱 。 这 样 使 用 两 栈 共 胖 空 间 存 储 方法 才 有 比较 大 的 总 

义 。 人 否则 两 个 栈 都 在 不 停 地 增长 ， 那 很 快 就 会 因 栈 满 而 溢出 了 。 











当然 ， 这 只 是 针对 两 个 具有 相同 数据 类 型 的 栈 的 一 个 设计 上 的 技巧 ， 如 
果 是 不 相同 数据 类 型 的 栈 ， 这 种 办 法 不 但 不 能 更 好 地 处 理 问 题 ， 反 而 会 
使 问题 变 得 更 复杂 ， 大 家 要 注意 这 个 前 提 。 








4.6 栈 的 链 式 存储 结构 及 实现 
4.6.1 栈 的 链 式 存储 结构 


人 


想 想 看 ， 栈 只 是 栈 项 来 做 插入 和 删除 操作 ， 栈 顶 放 在 链表 的 头 部 还 是 尾 
部 呢 ? 由 于 单 链表 有 头 指 针 ， 而 栈 顶 指针 也 是 必须 的 ， 那 干吗 不 让 它 俩 
合 二 为 一 呢 ， 所 以 比较 好 的 办 法 是 把 栈 顶 放 在 单 链表 的 头 部 〈 如 网 4-6-1 
所 示 ) 。 夯 外 ， 都 已 丝 有 了 栈 顶 在 头 部 了 ， 单 链表 中 比较 常用 的 头 绩 点 
也 束 失 去 了 意义 ， 通 常 对 于 链 栈 来 说 ， 是 不 需要 头 结 反 的 。 











图 4-6-1 





对 于 链 栈 来 说 ， 荣 本 个 存在 栈 满 的 情况 ， 除 莫 内 下 已 经 没有 可 以 使 用 由 
空间 ， 如 果真 的 发 生 ， 那 此 时 的 计算 机 操作 系统 已 经 面临 死机 骨 尝 的 情 
况 ， 而 不 是 这 个 链 栈 是 否 淤 出 的 问题 。 








但 对 于 空 栈 来 说 ， 链 表 原 定义 是 头 指针 指向 空 ， 那 么 链 栈 的 空 其实 就 是 
top=NULL 的 时 候 。 


链 栈 的 结构 代码 如 下 : 


typedef struct StackNode 


SElemType data: 

struct StackNode *next; 
} StackNode, *LinkStackPtr; 
typedef struct LinkStack 


LinkStackPtr top; 
int count; 
} LinkStack: 
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4.6.2 ” 栈 的 链 式 存 人 





对 于 链 栈 的 进 栈 push 操 作 ， 假 设 元 素 值 为 e 的 新 结 点 是 s，top 为 栈 顶 指 
针 ， 示 意图 如 图 4-6-2 所 示人 代码 如 下 。 








图 4-6-2 





/* 插入 元 素 e 为 新 的 栈 顶 元 素 */ 
Status Push(LinkStack *S, SElemType e) 





LinkStackPtr s 

= (LinkStackPtr )malloc(sizeof(StackNode) ) ; 
s->data = e; 
/* 把 当前 的 栈 顶 元 素 赋值 给 新 结 点 的 直接 后 继 ， 如 图 中 @ */ 
S->next = S->top; 
/* 将 新 的 结 点 S 赋 值 给 栈 项 指针 ， 如 图 中 @ */ 
S->top = S: 
S->count++; 
return OK; 





















































ih 


4.6.3” 栈 的 链 式 存储 结构 





出 栈 操作 





至 于 链 栈 的 出 栈 pop 操 作 ， 也 是 很 简 早 的 三 名 操作 。 假 设 变 量 p 用 来 存储 
eas 将 栈 项 指针 下 移 一 位 ， 最 后 释放 p 即 可 ， 如 图 4-6-3 
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图 4-6-3 











/* 若 栈 不 空 ， 则 删除 S 的 栈 顶 元 素 ， 用 e 返 回 其 值 ， 
并 返回 OK; 否则 返回 ERROR */ 

Status Pop(LinkStack *S, SElemType *e) 

£ 




















LinkStackPtr p; 
if (StackEmpty(*S)) 
return ERROR; 
*e = S->top->data; 
/* 将 栈 项 结 点 赋值 给 p， 如 图 @) */ 
D = S->top; 
/* 使 得 栈 顶 指针 下 移 一 位 ， 指 向 后 一 结 点 ， 如 图 四 */ 
S->top = S->top->next; 
/* 释放 结 点 p */ 
free(D): 
S->count--; 
return OK; 


























链 栈 的 进 栈 push 和 出 栈 pop 操 作 都 很 简单 ， 没 有 任何 循环 操作 ， 时 间 复 
奈 度 均 訪 0(1)。 





对 比 一 下 顺序 栈 与 链 栈 ， 它 们 在 时 间 复 杂 度 上 是 一 样 的 ， 均 为 0(D)。 对 
于 空间 性 能 ， 顺 序 栈 需 要 事先 确定 一 个 固定 的 长 度 ， 可 能 会 存在 内 存 空 
间 浪 费 的 问题 ， 但 它 的 优势 是 存 取 时 定位 很 方便 ， 而 链 栈 则 要 求 每 个 元 
素 都 有 指针 域 ， 这 同时 也 增加 了 一 些 内 存 开 销 ， 但 对 于 栈 的 长 度 无 限 

制 。 所 以 它们 的 区 别 和 线性 表 中 讨论 的 一 样 ， 如 果 栈 的 使 用 过 程 中 元 素 
变化 不 可 预料 ， 有 时 很 小 ， 有 时 非常 大 ， 那 么 最 好 是 用 链 栈 ， 反 之 ， 如 
果 它 的 变化 在 可 控 范 围 内 ， 建 议 使 用 顺序 栈 会 更 好 一 些 。 

















4.7 栈 的 作用 








有 的 同学 可 能 会 觉得 ， 用 数组 或 链表 直接 实现 功能 不 就 行 了 吗 ? 干吗 要 
引入 栈 这 样 的 数据 结构 呢 ? 这 个 问题 问 得 好 。 


其 实 这 和 我 们 明明 有 两 只 脚 可 以 走路 ， 王 吗 还 要 乘 汽车 、 火 车 、 飞 机 一 
样 。 理 论 上 ， 陆 地 上 的 任何 地 方 ， 你 都 是 可 以 靠 双 脚 走 到 的 ， 可 那 需要 
多 少时 间 和 精力 呢 ? 我 们 更 关注 的 是 到 达 而 不 是 如 何 去 的 过 程 。 


栈 的 引入 简化 了 程序 设计 的 问题 ， 划 分 了 不 同 关注 层次 ， 使 得 思考 范围 
缩小 ， 更 加 聚焦 于 我 们 要 解决 的 问题 核心 。 反 之 ， 像 数组 等 ， 因 为 要 分 
散 精 力 去 考虑 数组 的 下 标 增 减 等 细节 问题 ， 反 而 掩盖 了 问题 的 本 质 。 


所 以 现在 的 许多 高 级 语言 ， 比 如 Java、C# 等 都 有 对 栈 结构 的 封装 ， 你 可 
RE RSE CN 
常 方 便 。 


4.8” 栈 的 应 用 一 递归 





栈 有 一 个 很 重要 的 应 用 : 在 程序 设计 语言 中 实现 了 递归 。 那 么 什么 是 递 
归 呢 ? 


当 你 往 镜子 前 面 一 站 ， 镜 子 里 面 就 有 一 个 你 的 像 。 但 你 试 过 两 面 镜子 一 
起 照 吗 ? 如 果 A、B 两 面 镜 子 相 互 面 对 面 放 着 ， 你 往 中 间 一 站 ， 咖 ， 两 
面 镜 子 里 都 有 你 的 千 百 个 “化 身 ”。 为 什么 会 有 这 么 奇妙 的 现象 呢 ? 原 
来 ，A 镜 子 里 有 B 镜 子 的 像 ，B 镜 子 里 也 有 A 镜 子 的 像 ， 这 样 反 反复 复 ， 
就 会 产生 一 连 串 的 “ 像 中 像 ?。 这 是 一 种 递归 现象 ， 如 图 4-8-1 所 示 。 

















图 4-8-1 


我 们 先 来 看 一 个 经 典 的 递归 例子 : EWR] (Fibonacci) o X T i 
明 这 个 数列 ， 这 位 裴 老 还 举 了 一 个 很 形象 的 例子 。 


4.8.1 斐 波 那 契 数 列 实现 


说 如 果 兔 子 在 出 生 两 个 月 后 ， 就 有 繁殖 能 力 ， 一 对 兔子 每 个 月 能 生出 一 
对 小 兔子 来 。 假 设 所 有 免 都 不 死 ， 那 么 一 年 以 后 可 以 繁殖 多 少 对 兔子 
Ne? 





我 们 拿 新 出 生 的 一 对 小 兔子 分 析 一 下 : 第 一 个 月 小 兔子 没有 繁殖 能 

所 以 还 是 一 对 ; 两 个 月 后 ， 生 下 一 对 小 兔子 数 共 有 两 对 ; 三 个 月 以 后 ， 
老 兔 子 又 生 下 一 对 ， 因 为 小 兔子 还 没有 繁殖 能 力 ， 所 以 一 共 是 三 对 .……. 
依次 类 推 可 以 列 出 下 表 ( 表 4-8-1) 。 
































表 4-8-1 


表 中 数字 1，1，2，3，5，8，13...... 构 成 了 一 个 序列 。 这 个 数列 有 个 十 
分 明显 的 特点 ， 那 是 : 前 面相 邻 两 项 之 和 ， 构 成 了 后 一 项 ， 如 图 4-8-2 所 
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图 4-8-2 


可 以 发 现 ， 编 号 的 一 对 兔子 经 过 六 个 月 就 变 成 8 对 兔子 了 。 如 果 我 们 
FA BL PR BOR FE SU HE: 


), “n=0 
F(n)= | | 
Fin-1)+F(n-2), An>l 


先 考 慮 一 下 , 如果 我 休 要 詳 現 込 梓 的 数 列 用 常 規 的 途 代 的 法 如何 究 
現 ? 優 設 我 何 畜 要 打 印 出前 40 位 的 斐 渡 那 契 数 列 数 。 代 偶 如 下 : 


int mann( ) 


au aie fale 

int a[40]; 

a[9] = 0; 

a[1] = 1; 

pranti edia a OD 

yea ene Aol a aye 

EO (Gs = 2 ee AO ETE) 


cR S e e ae esl ey A 
Die Sool. a ly 


return 0; 


代码 很 简单 ， 几 乎 不 用 做 什么 解释 。 但 其 实 我 们 的 代码 ， 如 果 用 递归 来 
实现 ， 还 可 以 更 简单 。 








/* 斐 波 那 契 的 递归 函数 */ 
anita oa) 


algo (ale <a) 

retúrn i == TO O00 
/* 这 里 Fbi 就 是 函数 自己 ， 它 在 调用 自 
retUrn EDT I Eb 2 























pa 
LU 
SS 























int main() 


ali piesa 

for (i = 0; i < 40; i++) 
PT 二 全 人 本 于 DL 

return 0; 








NO ss 


怎 
费 点 脑子 。 


函数 怎么 可 以 自己 调用 自己 ? 听 起 来 有 些 难 以 理解 ， 不 过 你 可 以 不 要 把 
一 个 递归 函数 中 调用 自己 的 函数 看 作 是 在 调用 自己 ， 而 束 当 它 是 在 调 为 
一 个 函数 。 只 不 过 ， 这 个 函数 和 上 自己 长 得 一 样 而 已 。 


我 们 来 模拟 代码 中 的 FbiG) 函 数 当 i=5 的 执行 过 程 ， 如 图 4-8-3 所 示 。 





图 4-8-3 
4.8.2 ”递归 定义 


在 高 级 语言 中 ， 调 用 目 己 和 其 他 函数 并 没有 本 质 的 不 同 。 我 们 把 一 个 直 
AO 
PRI BBL 





当然 ， 写 地 归程 序 最 怕 的 就 是 陷入 水 不 结束 的 无 穷 递 归 中 ， 所 以 ， 每 个 
递归 定义 必须 至 少 有 一 个 条 件 ， 满 足 时 递归 不 再 进行 ， 即 不 再 引用 目 号 
而 是 返回 值 退出 。 比 如 刚才 的 例子 ， 总 有 一 次 递归 会 使 得 i<2 的 ， 这 样 
就 可 以 执行 return i 的 语句 而 不 用 继续 递归 了 。 





对 比 了 两 种 实现 斐 波 那 契 的 代码 。 友 代 和 递归 的 区 别 是 : 迭代 使 用 的 是 
循环 结构 ， 递 归 使 用 的 是 选择 结构 。 递 归 能 使 程序 的 结构 更 清晰 、 更 简 
洁 、 更 容易 让 人 理解 ， 从 而 减少 读 懂 代 码 的 时 间 。 但 是 大 量 的 递归 调用 
会 建立 函数 的 副本 ， 会 耗费 大 量 的 时 间 和 内 存 。 迭 代 则 不 需要 反复 调用 
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那么 我 们 讲 了 这 么 多 递归 的 内 容 ， 和 栈 有 什么 关系 呢 ? 这 得 从 计算 机 系 
统 的 内 部 说 起 。 


前 面 我 们 已 经 看 到 递归 是 如 何 执行 它 的 前 行 和 退回 阶段 的 。 递 归 过 程 退 
回 的 顺序 是 它 前 行 顺序 的 逆序 。 在 退回 过 程 中 ， 可 能 要 执行 某 些 动作 ， 
包括 恢复 在 前 行 过 程 中 存储 起 来 的 茶 些 数据 。 




















这 种 存储 茶 些 数据 ， 并 在 后 面 义 以 存储 的 逆序 恢复 这 些 数 据 ， 以 提供 之 
后 使 用 的 需求 ， 显 然 很 符合 栈 这 样 的 数据 结构 ， 因 此 ， 编 译 器 使 用 栈 实 
现 递归 就 没什么 好 惊讶 的 了 。 





简单 的 说 ， 就 是 在 前 行 阶段 ， 对 于 每 一 层 递 归 ， 函 数 的 局 部 变量 、 参 数 
值 以 及 返回 地 址 都 被 压 入 栈 中 。 在 退回 阶段 ， 位 于 栈 顶 的 局 部 变量 、 参 
数值 和 返回 地 址 被 弹出 ， 用 于 返回 调用 层次 中 执行 代码 的 其 余部 分 ， 也 
就 是 恢复 了 调用 的 状态 。 








当然 ， 对 于 现在 的 高 级 语言 ， 这 样 的 递归 问题 是 不 需要 用 户 来 管理 这 个 
ERAI, 一切 都 由 系统 代劳 了 。 


4.9 栈 的 应 用 一 ”四则 运算 表达 式 求 值 
4.9.1 Jak 〈 逆 波兰 ) 表示 法 定义 


栈 的 现实 应 用 也 很 多 ， 我 们 再 来 重点 讲 一 个 比较 各 见 的 应 用 : 数学 表达 
式 的 求 值 。 








我 们 小 学 学 数学 的 时 候 ， 有 一 句 话 是 老师 反复 强调 的 ,，“ 先 乘除 ， 后 加 
减 ， 从 左 算 到 在 ， 先 括号 内 后 括号 外 ”。 这 个 大 家 都 不 陌生 。 我 记得 我 
小 时 候 ， 天 天 做 这 种 加 减 乘除 的 数学 作业 ， 很 烦 ， 于 是 就 偷偷 拿 了 老区 
的 计算 器 来 帮 着 算 答 案 ， 对 于 单纯 的 两 个 数 的 加 减 乘 除 ， 的 确 是 省 心 不 
少 ， 我 也 因此 潇洒 了 一 两 年 。 可 后 来 要 求 要 加 减 乘 除 ， 甚 至 还 有 带 有 大 
中 小 括号 的 四 则 运算 ， 我 发 现 老 和 爸 那 个 简陋 的 计算 喜 不 好 使 了 了。 比如 9+ 
(3-TD)x3+10:2， 这 是 一 个 非常 简单 的 题目 ， 心 算 也 可 以 很 快 算 出 是 20。 
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当然 ， 后 来 出 的 计算 器 就 高 级 多 了 ， 它 引入 了 四 则 运算 表达 式 的 概念 ， 
也 可 以 输入 括号 了 ， 所 以 现在 的 00 后 的 小 朋友 们 ， 更 加 可 以 偷懒 、 抄 近 
路 做 数学 作业 了 。 








那么 在 新 式 计算 器 中 或 者 计算 机 中 ， 它 是 如 何 实现 的 昵 ? 如 果 让 你 用 C 
语言 或 其 他 高 级 语言 实现 对 数学 表达 式 的 求 值 ， 你 打算 如 何 做 ? 








这 里 面 的 困难 就 在 于 乘除 在 加 减 的 后 面 ， 却 要 先 运 算 ， 而 加 入 了 括号 
后 ， 就 变 得 更 加 复杂 。 不 知道 该 如 何 处 理 。 





但 仔细 观察 后 有 发现， 括号 都 是 成 对 出 现 的 ， 有 左 括号 就 一 定 会 有 右 括 

号 ， 对 于 多 重 括号 ， 最 终 也 是 完全 仍 套 匹配 的 。 这 用 栈 结构 正好 合适 ， 
REMSER, WREE TE MEKANA ZDE, KIE 
遇 到 左 括号 就 进 栈 ， 而 后 面 出 现 右 括号 时 ， 就 让 栈 项 的 左 括号 出 栈 ， 期 
间 让 数字 运算 ， 这 样 ， 最 终 有 括号 的 表达 陈 从 左 到 右 巡 碍 一 过 ， 栈 应 该 
古 由 空 到 有 元 素 ， 最 终 再 因 全 部 匹配 成 功 后 成 为 空 栈 。 














但 对 于 四 则 运算 ， 括 号 也 只 是 当 中 的 一 部 分 ， 先 乘除 后 加 减 使 得 问题 依 
然 复 杂 ， 如 何 有 效 地 处 理 它 们 呢 ? 我 们 伟大 的 科学 家 想到 了 好 办 法 。 


20 世 纪 50 年 代 ， 波 兰 逻 辑 学 家 Jan:ukasiewicz， 当 时 也 和 我 们 现在 的 同学 
们 一 样 ， 困 惑 于 如 何 才 可 以 搞定 这 个 四 则 运算 ， 不 知道 他 是 否 也 像 牛 顿 
被 苹果 砸 到 头 而 想到 万 有 引力 的 原理 ， 或 者 还 是 阿 基 米 德 在 浴 生 中 洗澡 
时 想到 判断 皇冠 是 否 纯 金 的 办 法 ， 总 之 他 也 是 灵感 突现 ， 想 到 了 一 种 不 
需要 括号 的 后 绥 表 达 法 ， 我 们 也 把 它 称 为 逆 波 兰 〈Reverse Polish 
Notation, RPN) 表示 。 我 想 可 能 是 他 的 名 字 太 复杂 了 ， 上 所 以 后 人 只 用 
他 的 国籍 而 不 是 姓名 来 命名 ， 实 在 可 惜 。 这 也 告诉 我 们 ， 想 要 流芳 百 

世 ， 名 字 还 要 起 得 明朗 上 口才 行 。 这 种 后 绥 表 示 法 ， 是 表达 式 的 一 种 新 
的 显示 方式 ， 非 常 巧 妙 地 解决 了 程序 实现 四 则 运算 的 难题 。 























我 们 先 来 看 看 ， 对 于 “9+(3-1)x3+10=*2”， 如 果 要 用 后 缀 表示 法 应 该 是 什 
么 样子 : “9 3 1-3*+102/+”， 这 样 的 表达 式 称 为 后 级 表达 式 ， 叫 后 级 的 原 
因 在 于 所 有 的 符号 都 是 在 要 运算 数字 的 后 面 出 现 。 显 然 ， 这 里 没有 了 括 
号 。 对 于 从 来 没有 接触 过 后 绥 表 达 式 的 同学 来 讲 ， 这 样 的 表述 是 很 难受 
的 。 不 过 你 不 喜欢 ， 有 机 器 喜欢 ， 比 如 我 们 聪明 的 计算 机 。 











49.2 后 级 表达 式 计算 结果 


为 了 解释 后 级 表达 式 的 好 处 ， 我 们 先 来 看 看 ， 计 算 机 如 何 应 用 后 级 表达 
式 计算 出 最 终 的 结果 20 的 。 


后 缀 表达 式 : 9 3 1-3*+10 2/+ 


规则 : 从 天 到 右 过 历 表达 式 的 每 个 数字 和 符号 ， 遇 到 古 数 字 惑 进 栈 ， 过 
到 是 符号 ， 就 将 处 于 栈 顶 两 个 数字 出 栈 ， 进 行 运算 ， 运 算 结 果 进 栈 ， 一 
直到 最 终 获 得 结果 。 


1. 初始 化 一 个 空 栈 。 此 栈 用 来 对 要 运算 的 数字 进出 使 用 。 如 图 4-9-1 的 
左 图 所 示 。 





2. 后 级 表达 式 中 前 三 个 都 是 数字 ， 所 以 9、3、1 进 栈 ， 如 图 4-9-1 的 右 图 


所 示 。 
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图 4-9-1 


3. 接 下 来 是 “-”， 所 以 将 栈 中 的 1 出 栈 作 为 减 数 ，3 出 栈 作 为 被 减 数 ， 并 
运算 3-1 得 到 2， 再 将 2 进 栈 ， 如 图 4-9-2 的 左 图 所 示 。 


4. 接 看 是 数字 3 进 栈 ， 如 图 4-9-2 的 右 图 所 示 。 





图 4-9-2 





5. 后 面 是 “*”， 也 就 意味 着 栈 中 3 和 2 出 栈 ，2 与 3 相 乘 ， 得 到 6， 并 将 6 进 
栈 ， 如 图 4-9-3 的 左 图 所 示 。 


6. 下 面 是 “+”， 所 以 栈 中 6 和 9 出 栈 ，9 与 6w 相 加 ， 得 到 15， 将 15 进 栈 ， 如 
图 4-9-3 的 右 图 所 示 。 


图 4-9-3 


7. 接着 是 10 与 2 两 数字 进 栈 ， 如 图 4-9-4 的 左 图 所 示 。 





8. 接 下 来 是 符号 “”， 因 此 ， 栈 顶 的 2 与 10 出 栈 ，10 与 2 相 除 ， 得 到 5， 将 
5 进 栈 ， 如 图 4-9-4 的 右 图 所 示 。 





图 4-9-4 








9. 最 后 一 个 是 符号 “+”， 所 以 15 与 5 出 栈 并 相 加 ， 得 到 20， 将 20 进 栈 ， 
如 图 4-9-5 的 左 图 所 示 。10. 结果 是 20 出 栈 ， 栈 变 为 空 ， 如 图 4-9-5 的 右 
图 所 示 。 
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图 4-9-5 


果然 ， 后 级 表达 法 可 以 很 顺利 解决 计算 的 问题 。 现 在 除了 睡觉 的 同学 ， 
应 该 都 有 同样 的 疑问 ， 就 是 这 个 后 级 表达 式 “9 3 1-3+70 2/+” 是 怎么 出 
来 的 ? 这 个 问题 不 搞 清楚 ， 等 于 没有 解决 。 所 以 下 面 ， 我 们 束 来 推导 如 
何 让 “9+(3-1)x3+10*2” 转 化 为 “9 3 1-3+10 2/+”。 





4.9.3 ”中 缀 表达 式 转 后 级 表达 式 





我 们 把 平时 所 用 的 标准 四 则 运算 表达 式 ， 即 “9+(3-1)x3+10=2” 叫 做 中 级 
表达 式 。 因 为 所 有 的 运算 符 写 都 在 两 数字 的 中 间 ， 现 在 我 们 的 问题 束 是 
中 级 到 后 级 的 转化 。 








中 级 表达 式 “9+(3-1)x3+10=-2” 转 化 为 后 级 表达 式 “9 3 1-3*+10 2/+”。 





规则 : 从 左 到 右 近 历 中 绥 表 达 式 的 每 个 数字 和 符号 ， 各 是 数字 就 输出 ， 
即 成 为 后 缀 表达 式 的 一 部 分 ; 大 是 符 写 ， 则 判断 其 与 栈 项 符号 的 优先 

级 ， 是 右 括号 或 优先 级 不 高 于 栈 顶 符号 《乘除 优先 加 减 )》 则 栈 顶 元 素 依 
次 出 栈 并 输出 ， 并 将 当前 符号 进 栈 ， 一 二 到 最 终 输 出 后 级 表达 式 为 止 。 





1. 初始 化 一 空 栈 ， 用 来 对 符号 进出 栈 使 用 。 如 图 4-9-6 的 左 图 所 示 。 
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图 4-9-6 


2. 第 一 个 字符 是 数字 9， 输 出 9， 后 面 是 符号 “+”， 进 栈 。 如 图 4-9-6 的 右 
图 所 示 。 





3. 第 三 个 字符 是 “(”， 依 然 是 符号 ， 因 其 只 是 左 括号 ， 还 未 配对 ， 故 进 
栈 。 如 图 4-9-7 的 左 图 所 示 。 


4， 第 四 个 字符 是 数字 3， 输 出 ， 总 表达 式 为 93， 接 着 是 <”， 进 栈 。 如 
图 4-9-7 的 右 图 





图 4-9-7 





5. 接 下 来 是 数字 1， 输 出 ， 总 表达 式 为 9 31， 后 面 是 符号 “)”， 此 时 ， 
我 们 需要 去 匹配 此 前 的 “”， 所 以 栈 顶 依次 出 栈 ， 并 输出 ， 直 到 “(” 出 栈 
为 止 。 此 时 左 括号 上 方 只 有 “-”， 因 此 输出 “<-”。 总 的 输出 表达 式 为 9 3 
1-。 如 图 4-9-8 的 左 图 所 示 。 


6. 紧 接着 是 符号 “x”， 因 为 此 时 的 栈 顶 符号 为 “+” 写 ， 优 先 级 低 于 “x”， 
因此 不 输出 ，“*” 进 栈 。 接 着 是 数字 3， 和 输出， 总 的 表达 式 为 9 3 1-3。 如 
图 4-9-8 的 右 图 所 示 。 
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图 4-9-8 


7. 之 后 是 符号 “+”， 此 时 当前 栈 顶 元 素 “? 比 这 个 “+ ?的 优先 级 高 ， 因 此 
栈 中 元 素 出 栈 并 输出 〈 没 有 比 “+ ”号 更 低 的 优先 级 ， 所 以 全 部 出 栈 ) , 
总 输出 表达 式 为 9 3 1-3+。 然 后 将 当前 这 个 符号 “+? 进 栈 。 也 就 是 说 ， 前 
6 张 图 的 栈 底 的 “+? 是 指 中 绥 表 达 式 中 开头 的 9 后 面 那 个 “+”， 而 图 4-9-9 左 
图 中 的 栈 底 《〈 也 是 栈 顶 ) 的 “+” 是 指 “9+(3-1)x3+” 中 的 最 后 一 个 “+”。 





8. 紧 接着 数字 10， 输 出 ， 总 表达 式 变 为 9 ”31-3*+10。 后 是 符号 “”， 所 
以 “/ 进 栈 。 如 图 4-9-9 的 右 图 所 示 。 
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图 4-9-9 


9. 最 后 一 个 数字 2， 输 出 ， 总 的 表达 式 为 9 31-3+70 2。 如 图 4-9-10 的 左 
图 所 示 。10. 因 已 经 到 最 后 ， 所 以 将 栈 中 符号 全 部 出 栈 并 输出 。 最 终 输 
出 的 后 级 表达 式 结果 为 93 1-3+10 2/+。 如 图 4-9-10 的 右 图 所 示 。 
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图 4-9-10 


从 刚才 的 推导 中 你 会 友 现 ， 要 想 让 计算 机 具有 处 理 我 们 通 第 的 标准 (中 
銀 ) 表达 式 的 能 力 ， 最 重要 的 吏 是 两 步 : 1. 将 中 级 表达 式 转化 为 后 级 表 
达 式 〈 栈 用 来 进出 运算 的 符号 ) 。 ”2. 将 后 级 表达 式 进 行 运算 得 出 结 
〈 栈 用 来 进出 运算 的 数字 ) 。 


整个 过 程 ， 都 充分 利用 了 栈 的 后 进 先 出 特性 来 处 理 ， 理 解 好 它 其 实 也 束 


理解 好 了 栈 这 个 数据 结构 。 


好 了 ， 休 妃 一 下 ， 一 会 儿 我 们 继续 ， 接 下 来 会 讲 队 列 。 


4.10 队列 的 定义 


你 们 在 用 电脑 时 有 没有 经 历 过 ， 机 器 有 时 会 处 于 疑似 死机 的 状态 ， 鼠 标 
点 什么 似乎 都 没 用 ， 双 击 任何 快捷 方式 都 不 动弹 。 就 当 你 失去 耐心 ， 打 
算 reset 时 。 突 然 它 像 酒 醒 了 一 样 ， 把 你 刚才 点 击 的 所 有 操作 全 部 都 按 顺 
序 执行 了 一 再 。 这 其 实 是 因为 操作 系统 中 的 多 个 程序 因 需 要 通过 一 个 通 
道 输出 ， 而 按 先 后 次 序 排队 等 待 造成 的 。 








再 比如 像 移 动 、 联 通 、 电 信 等 客服 电话 ， 客 服 人 员 与 客户 相 比 总 是 少 
数 ， 在 所 有 的 客服 人 员 都 占线 的 情况 下 ， 客 户 会 被 要 求 等 待 ， 直 到 有 东 
个 客服 人 员 空 下 来 ， 才 能 让 最 移 等 待 的 客户 接 通 电话 。 这 里 也 是 将 所 有 
当前 拨打 客服 电话 的 客户 进行 了 排队 处 理 。 





操作 系统 和 客服 系统 中 ， 都 是 应 用 了 一 种 数据 结构 来 实现 刚才 提 到 的 先 
进 先 出 的 排队 功能 ， 这 就 是 队列 。 


队列 〈queue) 是 只 允许 在 一 端 进行 插入 操作 ， 而 在 号 一 器 进行 删除 操 
作 的 线性 表 。 





队列 是 一 种 先进 先 出 (First In First Out) 的 线性 表 ， 简 称 FIFO。 人 允许 插 
入 的 一 端 称 为 队 尾 ， 人 允许 删除 的 一 端 称 为 队 头 。 假 设 队 列 是 q= 

(ai,a .ar)， 那 么 ai 就 是 队 头 元 素 ， 而 a 是 队 尾 元 素 。 这 样 我 们 就 可 以 
删除 时 ， 总 是 从 ai 开始 ， 而 揪 入 时 ， 列 在 最 后 。 这 也 比较 符合 我 们 通常 
生活 中 的 习惯 ， 排 在 第 一 个 的 优先 出 列 ， 最 后 来 的 当然 排 在 队伍 最 后 ， 
如 图 4-10-1 所 示 。 








图 4-10-1 








队列 在 程序 设计 中 用 得 非常 频繁 。 前 面 我 们 已 经 举 了 两 个 例子 ， 再 比如 
用 键盘 进行 各 种 字母 或 数字 的 输入 ， 到 显示 器 上 如 记事 本 软件 上 的 输 
出 ， 其 实 就 是 队列 的 典型 应 用 ， 假 如 你 本 来 和 女友 聊天 ， 想 表达 你 是 我 
sagt 输入 的 是 god， 而 屏幕 上 却 显示 出 了 dog 及 了 出 去 ， 这 真是 要 气 
BAS 





4.11 队列 的 抽象 数据 类 型 


同样 是 线性 表 ， 队 列 也 有 类 似 线 性 表 的 各 种 操作 ， 不 同 的 就 是 插入 数据 
只 能 在 队 尾 进行 ， 删 除数 据 只 能 在 队 头 进 行 。 


ADT 队列 (Queue) 





















































Data 

同 线性 表 。 元 素 具 有 相同 的 类 型 ， 相 邻 元 素 具 有 前 驱 和 后 继 关 系 。 
Operation 

InitQueue(*Q): 初始 化 操作 ， 建 立 一 个 空 队列 Q。 
















































































除 队列 Q 中 队 头 元 素 ， 并 用 e 返 回 其 值 。 
司 队 列 Q 的 元 素 个 数 








DeQueue(*Q, *e): 
QueueLength(Q): 
endADT 











DestroyQueue(*Q): 若 队列 Q 存 在 ， 则 销毁 它 。 
ClearQueue(*Q): ”将 队列 Q 清 空 
QueueEmpty(Q): 若 队 列 Q 为 室 ， 返 回 true， 否 则 返回 false。 
GetHead(Q，*e): ， 若 队 列 Q 存 在 且 非 空 ， 用 e 返 回 队列 Q 的 队 头 元 素 。 
EnQueue(*Q, e):  ” 若 队 列 Q 存 在 ， 插 入 新 元 素 e 到 队列 Q 中 并 成 为 队 尾 元 素 。 
删 
返 














4.12 循环 队列 


线性 表 有 顺序 存储 和 链 式 存 储 ， 栈 是 线性 表 ， 所 以 有 这 两 种 存储 方式 。 
同样 ， 队 列 作 为 一 种 特殊 的 线性 表 ， 也 同样 存在 这 两 种 存储 方式 。 我 们 
先 来 看 队列 的 顺序 存储 结构 。 


4.12.1 队列 顺序 存储 的 不 足 


我 们 假设 一 个 队列 有 n 个 元 素 ， 则 顺序 存储 的 队列 需 建立 一 个 大 于 n 的 数 
组 ， 并 把 队列 的 所 有 元 素 存 储 在 数组 的 前 n 个 单元 ， 数 组 下 标 为 0 的 一 端 
即 是 队 头 。 所 谓 的 入 队列 操作 ， 其 实 就 是 在 队 尾 追加 一 个 元 素 ， 不 需要 
移动 任何 元 素 ， 因 此 时 间 复杂 度 为 0(1)， 如 图 4-12-1 所 示 ， 
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图 4-12-1 


与 栈 不 同 的 是 ， 队 列 元 系 的 出 列 是 在 队 头 ， 即 下 标 为 0 的 位 置 ， 那 也 就 
意味 者 ， 队 列 中 的 所 有 元 素 都 得 同 前 移动 ， 以 保证 队列 的 队 头 ， 也 就 是 
下 标 为 0 的 位 置 不 为 室 ， 此 时 时 间 复 区 上 度 为 O(n)， 如 图 4-12-2 所 示 。 


图 4-12-2 


这 里 的 实现 和 线性 表 的 顺序 存储 结构 完全 相同 ， 不 再 详 述 。 





在 现实 中 也 是 如 此 ， 一 群 人 在 排队 买 票 ， 前 面 的 人 买好 了 离开 ， 后 面 的 
人 就 要 全 部 向 前 一 步 ， 补 上 空位 ， 似 乎 这 也 没什么 不 好 。 


可 有 时 想 想 ， 为 什么 出 队列 时 一 定 要 全 部 移动 呢 ， 如 果 不 去 限制 队列 的 
元 素 必 须 存 储 在 数组 的 前 n 个 单元 这 一 条 件 ， 出 队 的 性 能 就 会 大 大 增 
加 。 也 瓯 是 说 ， 队 头 不 需要 一 定 在 下 标 为 0 的 位 置 ， 如 岁 4-12-3 所 示 。 
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図 4-12-3 
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列 。 





假设 是 长 度 为 5 的 数组 ， 初 始 状态 ， 空 队列 如 图 4-12-4 的 左 图 所 示 ，front 

与 rear 指 针 均 指 问 下 标 为 0 的 位 置 。 然 后 入 队 a1、a，、a3、a4，front 指 针 

ML 而 rear 指 针 指 癌 下 标 为 4 的 位 置 ， 如 图 4-12-4 的 
示 。 
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图 4-12-4 


出 队 a1、a2， 则 front 指 针 指 向 下 标 为 2 的 位 置 ，rear 不 变 ， 如 图 4-12-5 的 
左 图 所 示 ， 再 入 队 as， 此 时 front 指 针 不 变 ，rear 指 针 移 动 到 数组 之 外 。 
HE? 数组 之 外 ， 那 将 是 哪里 ? 如 图 4-12-5 的 右 图 所 示 。 
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图 4-12-5 





问题 还 不 止 于 此 。 假 设 这 个 队列 的 总 个 数 不 超 过 5 个 ， 但 目前 如 果 接 着 
入 队 的 话 ， 因 数组 末尾 元 系 已 经 占用 ， 和 再 癌 后 加 ， 就 会 产生 数组 越界 的 
错误 ， 可 实际 上 ， 我 们 的 队列 在 下 标 为 0 和 1 的 地 方 还 是 空闲 的 。 我 们 把 
这 种 现象 叫做 “ 假 溢出 ”。 





现实 当中 ， 你 上 了 公交 车 ， 发 现 前 排 有 两 个 空 座位 ， 而 后 排 所 有 座位 都 
已 经 坐 满 ， 你 会 怎么 做 ? 立马 下 车 ， 并 对 目 己 说 ， 后 面 没 座 了 ， 我 等 下 
一 辆 ? 


没有 这 么 尝 的 人 ， 前 面 有 座位 ， 当 然 也 是 可 以 坐 的 ， 除 非 坐 满 了 了， 才 会 
考虑 下 一 辆 。 


4.12.2 ”循环 队列 定义 


所 以 解决 假 汶 出 的 办 法 就 是 后 面 满 了 ， 就 再 从 头 开 始 ， 也 瓯 是 头 尾 相 接 
的 循环 。 我 们 把 队列 的 这 种 头 尾 相 接 的 顺序 存储 结构 称 为 循环 队列 。 


刚才 的 例子 继续 ， 图 4-12-5 的 rear 可 以 改 为 指 癌 下 标 为 0 的 位 置 ， 这 样 惑 
` 会 造成 指针 指 同 不 明 的 问题 了 ， 如 图 4-12-6 所 示 。 





rear front 





图 4-12-6 

接着 入 队 ae， 将 它 放 置 于 下 标 为 0 处 ，rear 指 针 指 同 下 标 为 1 处 ， 如 图 4- 
12-7 的 左 图 所 示 。 若 再 入 队 av， 则 rear 指 针 就 与 front 指 针 重 合 ， 同 时 指向 
下 标 为 2 的 位 置 ， 如 图 4-12-7 的 右 图 所 示 。 
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图 4-12-7 


o 此 时 间 题 又 出 来 了 了， 我 们 刚才 说 ， 空 队列 时 ，front 等 于 rear， 现 在 
当 队 列 满 时 ， 也 是 front 等 于 rear， 那 么 如 何 判 断 此 时 的 队列 究竟 是 
空 还 是 满 呢 ? 

办 法 一 是 设置 一 个 标志 变量 flag， 当 front==rear， 且 flag=0 时 为 队列 
容 ， 当 front==rear， 且 flag=1 时 为 队列 满 。 

办 法 二 是 当 队 列 空 时 ， 条 件 就 是 front=rear， 当 队列 满 时 ， 我 们 修改 
其 条 件 ， 保 留 一 个 元 素 空 间 。 也 就 是 说 ， 队 列 满 时 ， 数 组 中 还 有 一 
个 空 用 单元 。 例 如 图 4-12-8 所 示 ， 我 们 就 认为 此 队列 已 经 满 了 ， 也 
就 是 说 ， 我 们 不 允许 图 4-12-7 的 右 图 情况 出 现 。 
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图 4-12-8 


我 们 重点 来 讨论 第 二 种 方法 ， 由 于 rear 可 能 比 front 大 ， 也 可 能 比 front 

小 ， 所 以 尽管 它们 只 相差 一 个 位 置 时 就 是 满 的 情况 ， 但 也 可 能 是 相差 整 
整 一 疾 。 所 以 奉 队 列 的 最 大 尺寸 为 QueueSize， 那 么 队列 满 的 条 件 是 
(rear+1)96QueueSize==front ( 取 模 “96” 的 目的 就 走 丸 了 整合 rear 与 front 大 
小 为 一 个 问题 》。 比 如 上 面 这 个 例子 ，QueueSize=5， 图 4-12-8 的 左 图 中 
front=0， 而 rear=4，(4+1)9%5=0， 所 以 此 时 队列 满 。 再 比如 图 4-12-8 中 的 
右 图 ，front=2 而 rear=1。(1+1)%5=2， 所 以 此 时 队列 也 是 满 的 。 而 对 于 
图 4-12-6，front=2 而 rear=0，(0+1)%5=1，1z2， 所 以 此 时 队列 并 没有 
满 。 





另外 ， 当 rear>front 时 ， 即 图 4-12-4 的 右 图 和 4-12-5 的 左 图 ， 此 时 队列 的 
长 度 为 rear-front。 但 当 rear<front 时 ， 如 图 4-12-6 和 图 4-12-7 的 左 图 ， 队 
列 长 度 分 为 两 段 ， 一 段 是 QueueSize-front， 另 一 段 是 0+rear， 加 在 一 

人 


(rear-front+QueueS1ze )%QueueS1ze 
有 J 了 这些 讲解 ， 现 在 实现 循环 队列 的 代码 就 不 难 了 。 


循环 队列 的 顺序 存储 结构 代码 如 下 : 

















/* QElemType 类 型 根据 实际 情况 而 定 ， 这 里 假设 为 int */ 
typedef int QElemType; 

/* 循环 队列 的 顺序 存储 结构 */ 

typedef struct 


QElemType data[MAXSTZE] / 
f Sri Os 
Inte hon ty: 
* 尾 指针 ， 若 队列 不 空 ， 
指向 队列 尾 元 素 的 下 一 个 位 置 */ 
int rear; 
} SqQueue; 
































循环 队列 的 初始 化 代码 如 下 : 


/* 初始 化 一 个 空 队列 Q */ 
Status InitQueue(SqQueue *Q) 


Q->front = 0; 
Q->rear = 0; 
return OK; 


ih 


循环 队列 求 队列 长 度 代 码 如 下 : 














/* 返回 Q 的 元 素 个 数 ， 也 就 是 队列 的 当前 长 度 */ 
int QueueLength(SqQueue Q) 


return (Q.rear - Q.front + MAXSIZE) % MAXSIZE; 


循环 队列 的 入 队列 操作 代码 如 下 : 











/* 若 队列 未 满 ， 则 插入 元 素 e 为 Q 新 的 队 尾 元 素 */ 
Status EnQueue(SqQueue *Q, QElemType e) 
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/* 队列 满 的 判断 */ 

if ((Q->rear + 1) % MAXSIZE == Q->front) 
return ERROR: 

/* 将 元 素 e 赋 值 给 队 尾 */ 

Q->data[Q->rear] = e; 

/* reariit law ME */ 

Q->rear = (Q->rear + 1) % MAXSIZE; 

/* 若 到 最 后 则 转 到 数组 头 部 */ 


return OK; 





























循环 队列 的 出 队列 操作 代码 如 下 : 

















/* 若 队列 不 空 ， 则 删除 Q 中 队 头 元 素 ， 用 e 返 回 其 值 */ 
Status DeQueue(SqQueue *Q, QElemType *e) 
{ 























/* 队列 空 的 判断 */ 
if (Q->front == Q->rear) 
return ERROR; 
/* 将 队 头 元 素 赋值 给 e */ 
*e = Q->data[Q- MA 
j> front 指 针 向 后 移 位 uf 
Q->front = (Q->front + 1) % MAXSIZE; 
/* 若 到 最 后 则 转 到 数组 头 部 */ 


return OK; 





























从 这 一 段 讲 解 ， 大 家 应 该 发 现 ， 单 是 顺序 存储 ， 知 不 是 循环 队列 ， 算 法 
的 时 间 性 能 是 不 高 的 ， 但 循环 队列 又 面临 着 数组 可 能 会 洪 出 的 问题 ， 所 
以 我 们 还 需要 研究 一 下 不 需要 担心 队列 长 度 的 链 式 存 储 结构 。 





4.13 ”队列 的 链 式 存储 结构 及 实现 





队列 的 链 式 存储 结构 ， 其 实 就 是 线性 表 的 单 链表 ， 只 不 过 它 只 能 尾 进 头 
出 而 已 ， 我 们 把 它 简 称 为 链 队 列 。 为 了 操作 上 的 方便 ， 我 们 将 队 尖 指针 
指 回 链 队 列 的 头绪 点 ， 而 队 尾 指针 指 癌 终端 结 点 ， 如 图 4-13-1 所 示 。 
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图 4-13-1 


空 队 列 时 ，front 和 rear 都 指 癌 头 结 点 ， 如 图 4-13-2 所 示 。 
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链 队 列 的 结构 为 : 

















/* QE1LemType 类 型 根据 实际 情况 而 定 ， 这 里 假设 为 int */ 
typedef int QElemType; 

/* 结 点 结构 */ 

typedef struct QNode 

{ 





QElemType data; 
struct QNode *next; 
QNode, *QueuePtr; 
/* 队列 的 链表 结构 */ 
typedef struct 





/* 队 头 、 队 尾 指针 */ 
QueuePtr front, rear: 
} LinkQueue; 


4.13.1 队列 的 链 式 存储 结构 入 队 操 作 





入 队 操 作 时 ， 其 实 就 是 在 链表 尾部 插入 结 皮 ， 如 图 4-13-3 所 示 。 
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图 4-13-3 


其 代码 如 下 : 


/* 插入 元 素 e 为 Q 的 新 的 队 尾 元 素 */ 
Status EnQueue(LinkQueue *Q, QElemType e) 


QueuePtr s = 
(QueuePtr )malloc(sizeof(QNode) ) ; 
/* 存储 分 配 失败 */ 
LEOS) 
exit (OVERFLOW); 
s->data = e; 
s->next = NULL; 
/* 把 拥有 元 素 e 新 结 点 s 赋 值 给 原 队 尾 结 点 的 后 继 ， */ 
Q->rear->next = s; 
/* 見 上 図 中 ① */ 
/* 把 当前 的 s 设 置 为 队 尾 结 点 ，rear 指 向 s， 见 上 图 中 @ */ 
Q->rear = S: 
return OK; 

































































} 


4.13.2 ”队列 的 链 式 存储 结构 





出 队 操作 





出 队 操作 时 ， 就 是 头 结 点 的 后 继 结 点 出 队 ， 将 头 结 点 的 后 继 改 为 它 后 面 
的 结 点 ， 若 链表 除 头 结 点 外 只 剩 一 个 元 素 时 ， 则 需 将 rear 指 向 头 结 点 ， 
如 图 4-13-4 所 示 。 


 Hoflifront->next Ò Ui 





图 4-13-4 


代码 如 下 : 




















/* 若 队列 不 空 ， 删 除 Q 的 队 头 元 素 ， 用 e 返 回 其 值 ， 

并 返回 OK， 和 否则 返回 ERROR */ 

Status DeQueue(LinkQueue *Q, QElemType *e) 
{ 




















QueuePtr p; 
if (Q->front == Q->rear) 
return ERROR; 
j 除 的 队 头 结 点 暂 存 给 p， 见 上 图 中 四 */ 
front->next; 


HRB A KATEN e z 
RAAR- >next 赋 值 给 头 结 点 后 继 ， */ 


aa >next = p->next; 
pafas] 
・ EUW. 则 删除 后 将 rear 指 向 头 结 点 ， 见 上 图 中 @@) */ 
if (Q->rear == p) 

Q->rear = Q->front; 
free(p); 
return OK; 
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对 于 循环 队列 与 链 队 列 的 比较 ， 可 以 从 两 方面 来 考虑 ， 从 时 间 上 ， 其 实 

它们 的 基本 操作 都 是 第 数 时 间 ， 即 都 为 O(1) 的 ， 不 过 循环 队列 是 事先 申 
请 好 空间 ， 使 用 期 间 不 释放 ， 而 对 于 链 队列 ， 每 次 申请 和 释放 结 点 也 会 
存在 一 些 时 间 开 销 ， 如 果 入 队 出 队 频 系 ， 则 两 者 还 是 有 细微 差异 。 对 于 
TERY: TPR APU AVT-TIBIREMIISBE, MARA T Fe fe 70 38 
BUM ZS AR eH A. MEDIATE Pel, RE E m — 8 
S ATE EENEI, UTME, MEERE, 链 队列 

Hey 

















总 的 来 说 ， 在 可 以 确定 队列 长 度 最 大 值 的 情况 下 ， 建 议 用 循环 队列 ， 如 
果 你 无 法 预 佑 队列 的 长 度 时 ， 则 用 链 队列 。 


4.14 总结 回 顾 


又 到 了 总 结 回顾 的 时 间 。 我 们 这 一 半 讲 的 是 栈 和 队列 ， 它 们 都 是 特殊 的 
线性 表 ， 只 不 过 对 插入 和 删除 操作 做 了 限制 。 











$k (stack) 是 限定 仅 在 表 尾 进行 插入 和 删除 操作 的 线性 表 。 


队列 〈queue) 是 只 允许 在 一 端 进行 插入 操作 ， 而 在 号 一 问 进 行 删 除 操 
作 的 线性 表 。 





它们 均 可 以 用 线性 表 的 顺序 存储 结构 来 实现 ， 但 都 存在 独 顺 序 存 储 的 一 
些 束 只 。 因 此 它们 各 和 目 有 各 目的 技巧 来 解决 这 个 问题 。 


对 于 栈 来 说 ， 如 果 是 两 个 相同 数据 类 型 的 栈 ， 则 可 以 用 数组 的 两 端 作 栈 
底 的 方法 来 让 两 个 栈 共 吝 数据， 这 就 可 以 最 大 化 地 利用 数组 的 空间 。 








对 于 队列 来 说 ， 为 了 避免 数组 插入 和 删除 时 需要 移动 数据 ， 于 是 就 引入 
了 循环 队列 ， 使 得 队 头 和 队 尾 可 以 在 数组 中 循环 变化 。 解 决 了 移动 数据 
的 时 间 损 耗 ， 使 得 本 来 插入 和 删除 是 OO) 的 时 间 复 杂 度 变 成 了 O(1)。 


它们 也 都 可 以 通过 链 式 存储 结构 来 实现 ， 实 现 原 则 上 与 线性 表 基 本 相同 
如 图 4-14-1 所 示 。 
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4.15 结尾 语 





好 了 ， 最 后 两 分 钟 ， 念 几 句 我 在 初学 栈 和 队列 时 写 的 人 生 感 悟 的 小 诗 ， 
希望 也 能 引起 你 们 的 共鸣 。 


人 生 ， 束 像 是 一 个 很 大 的 栈 演变 。 出 生 时 你 赤 条 条 地 来 到 人 世 ， 慢 慢 地 
长 大 ， 渐 渐 地 变 老 ， 最 终 还 得 亦 条 条 地 离开 世间 。 








人 生 ， 又 仿佛 是 一 天 一 天 小 小 的 栈 重 现 。 童 年 父母 每 天 抱 你 不 断 地 进出 
ee ge er eee en 
g 门 里 屋 前 。 








人 生 ， 更 需要 有 进 栈 出 栈 精神 的 体现 。 在 哪里 跌倒 ， 就 应 该 在 哪里 爬 起 
来 。 无 论 陷 入 何等 困境 ， 只 要 抬头 能 仰望 更 天， 就 有 希望 ， 不 断 进取 ， 
你 就 可 以 让 出 头 之 日 重 现 。 困 难 不 会 永远 存在 ， 强 者 才能 勇往直前 。 











人 人生， 其实 就 是 一 个 大 大 的 队列 演变 。 无 知 童年 、 快 乐 少年 ， 稚 做 至 
E, 成就 中 年 , KERE, 





人 生 ， 又 是 一 个 又 一 个 小 小 的 队列 重 现 。 春 夏秋 冬 轮回 年 年 ， 早 中 晚 夜 
循环 天 天 。 变 化 的 是 时 间 ， 不 变 的 是 你 对 未 来 执著 的 信念 。 








人 生 ， 更 需要 有 队列 精神 的 体现 。 南 极 到 北极 ， 不 过 是 南 纬 90 度 到 北纬 
90 度 的 队列 ， 如 宁 你 中 途 犹 殉 ， 临 时 转向 ， 也 许 你 就 只 能 和 企 狼 相伴 永 
远 。 可 事实 上 ， 无 论 哪 个 方向 ， 只 要 你 坚持 到 底 ， 你 都 可 以 到 达 终 点 。 





WKAR, PR. 





申 : 
P (string) 是 由 零 个 或 多 个 字符 组 成 的 有 限 序 列 ， 又 名 叫 字 符 串 。 


5.1 开场 日 


同学 们 ， 大 家 好 ! 我 们 开始 上 新 的 一 谍 。 


我 们 古人 没有 电影 电视 ， 没 有 游戏 网 络 ， 所 以 文人 们 就 会 想 出 一 些 文 字 
游戏 来 娱乐 。 比 如 宋代 的 李 帅 写 了 这 样 一 首 诗 :“ 杜 眼 望 遥 山 隔 水 ， 往 
来 曾 见 几 心 知 ? 谈 空 怕 酌 一 杯 酒 ， 笔 下 难 成 和 韵 诗 。 途 路 阻 人 离别 久 ， 
讯 音 无 雁 寄 回 迟 。 扳 灯 夜 守 长 这 我 ， 夫 忆 妻 今 父 忆 儿 。? 显 然 这 是 老公 
想念 老 疲 和子 的 封 句 。 曽 希 和 妻 介在 一 起 , REA ZA, 現在 一 人 
人 长 久 没 有 回 家 ， 也 不 见 书 信 返 回 ， 望 着 油灯 想念 杀人 ， 能 不 伤感 吗 ? 








可 再 仔细 一 读 发 现 ， 这 首 诗 苋 然 可 以 倒 过 来 读 :“ 儿 忆 父 分 妻 忆 夫 ， 和 下 
守 长 守夜 灯 孤 。 迟 回 寄 雁 无 音讯 ， 久 别离 人 阻 路 途 。 诗 韵 和 成 难 下 笔 ， 
酒杯 一 酌 怕 空 亚 。 知 心 几 见 曾 来 往 ， 水 隔山 遥望 眼 顶 。?” 这 表达 了 什么 
意思 呢 ? 呵呵 ， 表 达 了 和 妻子 对 丈夫 的 思念 。 老 公 离 开 好 入 ， 路 途 遥 远 ， 
难以 相 见 。 写 信 不 知道 写 什 么 ， 独 自 哆 酒 也 没什么 兴致 。 只 能 和 儿子 夜 
夜 守 在 家 里 一 蔓 拆 灯 下 ， 兰 等 老公 的 归来 。 














这 种 主体 叫 做 回 文 诗 。 它 是 一 种 可 以 倒 读 或 反复 回旋 阅读 的 请 体 。 刚 才 








这 首 就 是 正 读 是 丈夫 思念 妻子 ， 倒 读 是 妻子 思念 丈夫 的 古诗 。 是 不 是 感 
觉 很 奇妙 呢 ? 
TE (KAY WOE : 


在 英语 单词 中 ， 同 样 有 神奇 的 地 方 。 “即使 是 lover 也 有 个 over， 即 使 是 
friend 也 有 个 end， 即 使 是 believe 也 有 个 lie。” 你 会 发 现 ， 本 来 不 相干 ， 其 
至 对 并 的 两 个 词 ， 却 有 某 种 神奇 的 联系 。 这 可 能 是 创造 这 几 个 单词 的 那 
些 智者 们 也 没有 想到 的 问题 。 





今天 我 们 束 要 来 谈 谈 这 些 单词 或 句子 组 成 字符 串 的 相关 问题 。 


5.2 串 的 定义 


早先 的 计算 机 在 被 发 明 时 ， 主 要 作用 是 做 一 些 科学 和 工程 的 计算 工作 ， 
也 就 是 现在 我 们 理解 的 计算 器 ， 只 不 过 它 比 小 小 计算 器 功能 更 强大 、 速 
度 更 快 一 些 。 后 来 有 发现， 在 计算 机 上 作 非 数值 处 理 的 工作 越 来 越 多 ， 使 
得 我 们 不 得 不 需要 引入 对 字符 的 处 理 。 于 是 就 有 了 字符 串 的 概念 。 











比如 我 们 现在 稼 用 的 搜索 引擎 ， 当 我 们 在 文本 框 中 输入 “数据 ”时 ， 它 已 
经 把 我 们 想 要 的 “数据 结构 ? 列 在 下 面 了 。 显 然 这 里 网 站 作 了 一 个 字符 串 
查找 匹配 的 工作 ， 如 图 5-2-1 所 示 。 








图 5-2-1 


今天 我 们 就 是 来 研究 “ 串 ” 这 样 的 数据 结构 。 移 来 看 定义 。 





P (string) 是 由 零 个 或 多 个 字符 组 成 的 有 限 序 列 ， 又 名 叫 字 符 串 。 


一 般 记 为 s="aljao.…..au"(nz0)， 其 中 ，s 是 串 的 名 称 ， 用 双 引 号 〈 有 些 书 
中 也 用 单 引 号 ) 括 起 来 的 字符 序列 是 串 的 值 ， 注 意 引 号 不 属于 串 的 内 

容 。 a (1sisn) 可 以 是 字母 、 数 字 或 其 他 字符 ，i 束 是 该 字符 在 串 中 的 
位 置 。 串 中 的 字符 数目 n 称 为 串 的 长 度 ， 定 义 中 谈 到 “有 限 ? 是 指 长 度 n 是 
一 个 有 限 的 数值 。 零 个 字符 的 串 称 为 空 串 〈nullstring) ， 它 的 长 度 为 

零 ， 可 以 直接 用 两 双 引 写 “"” 表 示 ， 也 可 以 用 希腊 字母 “<@” 来 表示 。 所 
谓 的 序列 ， 说 明 串 的 相 邻 字符 之 间 具 有 前 驱 和 后 继 的 关系 。 























还 有 一 些 概 念 需 要 解释 。 


空格 串 ， 是 只 包含 空格 的 串 。 注 意 它 与 空 串 的 区 别 ， 空 格 串 是 有 内 容 有 
长 度 的， 而 且 可 以 不 止 一 个 空格 。 


子弟 与 主 串 ， 串 中 任意 个 数 的 连续 字符 组 成 的 子 序列 称 为 该 串 的 子 串 ， 
相应 地 ， 包 含 子 串 的 串 称 为 主 串 。 





子 串 在 主 串 中 的 位 置 就 是 子 串 的 第 一 个 字符 在 主 吕 中 的 序号 。 


开头 我 所 提 到 的 “over” “end”. “lie” 其 实 可 以 认为 
fe “lover”. “friend”, “believe” 这 些 单词 字符 串 的 子 串 。 


5.3 串 的 比较 


两 个 数字 ， 很 容易 比较 大 小 。2 比 1 大 ， 这 完全 正确 ， 可 是 两 个 字符 串 如 
何 比较 ? 比如 “sily”“stupid" 这 样 的 同样 表达 “愚蠢 的 ?的 单词 字符 串 ， 
它们 在 计算 机 中 的 大 小 其 实 取 决 于 它们 挨个 字母 的 前 后 顺序 。 它 们 的 第 
一 个 字母 都 是 <s”， 我 们 认为 不 存在 大 小 差异 ， 而 第 二 个 字母 ， 由 

于 “字母 比 “ 字 母 要 靠 前 ， 所 以 “<“t， 于 是 我 们 说 “silly”<“stupid”。 








事实 上 ， 串 的 比较 是 通过 组 成 串 的 字符 之 间 的 编码 来 进行 的 ， 而 字符 的 
编码 指 的 是 字符 在 对 应 字符 集中 的 序号 。 








计算 机 中 的 常用 字符 是 使 用 标准 的 ASCII 编 码 ， 更 准确 一 点 ， 由 7 位 二 进 
制 数 表 示 一 个 字符 ， 总 共 可 以 表示 128 个 字符 。 后 来 发 现 一 些 特 殊 符 号 
的 出 现 ，128 个 不 够 用 ， 于 是 扩展 ASCII 码 由 8 位 二 进 制 数 表示 一 个 字 
符 ， 总 共 可 以 表示 256 个 字符 ， 这 已 经 足够 满足 以 英语 为 主 的 语言 和 特 
殊 符 号 进行 输入 、 存 储 、 输 出 等 操作 的 字符 需要 了 。 可 是 ， 单 我 们 国家 
就 有 除 汉 族 外 的 满 、 回 、 藏 、 蒙 古 、 维 普尔 等 多 个 少数 民族 文字 ， 换 作 
全 志 界 估计 要 有 成 百 上 千 种 语言 与 文字 ， 显 然 这 256 个 字符 是 不 够 的 ， 
因此 后 来 就 有 了 Unicode 编 码 ， 比 较 常 用 的 是 由 16 位 的 三 进 制 数 表 示 一 
个 字符 ， 这 样 总 共 就 可 以 表示 2 














16 个 字符 ， 约 是 6.5 万 多 个 字符 ， 足 够 表示 世界 上 所 有 语言 的 所 有 字符 
了 。 当 然 ， 为 了 和 ASCII 码 兼容 ，Unicode 的 前 256 个 字符 与 ASCII 码 完全 
相同 。 


所 以 如 果 我 们 要 在 C 语 言 中 比较 两 个 串 是 个 相等 ， 必 须 是 它们 串 的 长 度 
以 及 它们 各 个 对 应 位 置 的 字符 都 相等 时 ， 才 算是 相等 。 即 给 定 两 个 串 : 
s="a ィ ao…… コ ビリ "bb っ .…b。", 当 是 似 当 n=m, Hasbi; a=by, ...... 
au=bu 时 ， 我 们 认为 s=t。 


那么 对 于 两 个 串 不 相等 时 ， 如 何 判 定 它 们 的 大 小 呢 。 我 们 这 样 定义 : 


给 定 两 个 串 : S="a,a5 Eees an ， t="b,b> eee Dis 当 满 足以 下 条 件 之 一 时 ， 
S<t。 


1. n<m, Hab; (i=1, 2, ...... 2 Da 


例如 当 s=“hap”，t=“happy”， 就 有 s<t。 因 为 t 比 s 多 出 了 两 个 字母 。 


2 存在 菜 个 kgmin(m; n) , Earb Gi=1, 2, ...... 2 
ak<br。 





例如 当 s="happen"，t="happy"， 因 为 两 串 的 前 4 个 字母 均 相 同 ， 而 两 串 
第 5 个 字母 (k 值 ) ， 字 母 e 的 ASCII 码 是 101， 而 字母 y 的 ASCII 码 是 121， 
显然 e<y， 所 以 s<t。 


人 那 我 再 说 一 个 字符 串 比 较 的 
MHo 


我 们 的 英语 词典 ， 通 常 都 是 上 万 个 单词 的 有 序 排列 。 束 大 小 而 言 ， 前 面 
eo a 你 在 查找 单词 的 过 程 ， 其 实 就 是 在 比较 字符 串 大 
小 的 过 程 。 
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图 5-3-1 


WL? 有 同学 说 ， 从 不 查 纸 质 词典 ， 都 是 用 电子 词典 。 电 子 词典 查找 单词 
实现 的 原理 ， 其 实 就 是 字符 串 这 种 数据 结构 的 典型 应 用 ， 随 着 我 们 之 后 
的 讲解 ， 大 家 就 会 明白 。 


5.4 串 的 抽象 数据 类 型 


串 的 逻辑 结构 和 线性 表 很 相似 ， 不 同 之 处 在 于 串 针 对 的 是 字符 集 ， 也 就 
是 串 中 的 元 素 都 是 字符 ， 哪 怕 串 中 的 字符 是 “123” 这 样 的 数字 组 成 ， 或 
者 “2010-10-10” 这 样 的 日 期 组 成 ， 它 们 都 只 能 理解 为 长 度 为 3 和 长 度 为 10 
的 字符 串 ， 每 个 元 素 都 是 字符 而 已 。 











因此 ， 对 于 串 的 基本 操作 与 线性 表 是 有 很 大 差别 的 。 线 性 表 更 关注 的 是 
单个 元 系 的 操作 ， 比 如 查找 一 个 元 素 ， 插 入 或 删除 一 个 元 素 ， 但 捉 中 更 
多 的 是 查找 子 串 位 置 、 得 到 指定 位 置 子囊 、 葡 换 子 串 等 操作 。 





ADT (string) 























































































































































































































































































































Data 
串 中 元 素 仅 由 一 个 字符 组 成 ， 相 邻 元 素 具 有 前 驱 和 后 继 关 系 。 
Operation 

StrAssign(T, *chars): 生成 一 个 其 值 等 于 字符 串 常量 chars 的 串 T。 

SECO YS 串 S 存 在 ， 由 串 S 复 制 得 串 T。 

ClearString(S): 串 S 存 在 ， 将 串 清 空 。 

StringEmpty(S): 若 串 S$ 为 空 ， 返 回 true， 否 则 返回 false。 

StrLength(S) : 返回 串 S 的 元 素 个 数 ， 即 串 的 长 度 。 

StrCompare(S, T): 若 S>T, 返 回 値 >9, 若 S=T, 返 回 9, 若 S<T, 返 回 値 <6。 

Concat(T, S1, S2): 用 T 返 回 由 S1 和 S2 联 接 而 成 的 新 串 。 

SubString(Sub, S, pos, len): 串 S 存 在 ，1<pos<StrLength(S)， 
且 @s1ensStrLength(S) - pos+1, 用 Sub 返 
回 串 S 的 第 pos 个 字符 起 长 度 为 len 的 子 串 。 

Index(S, T, pos): 串 S 和 T 存 在 ，T 是 非 空 串 ，1<pos<StrLength(S)。 
若 主 串 S 中 存在 和 串 T 值 相同 的 子囊 ， 则 返回 它 在 主 串 S 中 
第 pos 个 字符 之 后 第 一 次 出 现 的 位 置 ， 否 则 返回 90。 

Replace(S, T, V): 串 S、T 和 V 存 在 ，T 是 非 空 串 。 用 V 蔡 换 主 串 S 中 出 现 的 所 有 
TRAE HAS HES IEE 

StrInsert(S, pos, T): 串 S 和 T 存 在 , 1<possStrLength(S)+1. 
在 串 S 的 第 pos 个 字符 之 前 插入 串 T。 

StrDelete(S, pos, len): 串 S 存 在 , 1spossStrLength(S) - 1en+1。 
从 串 S 中 删除 第 pos 个 字符 起 长 度 为 en 的 子 串 。 

















endADT 


对 于 不 同 的 高 级 语言 ， 其 实 对 串 的 基本 操作 会 有 不 同 的 定义 方法 ， 所 以 
同学 们 在 用 某 个 语言 操作 字符 串 时 ， 需 要 先 查 看 它 的 参考 手册 关于 字符 
串 的 基本 操作 有 哪些 。 不 过 还 好 ， 不 同 语言 除 方法 名 称 外 ， 操 作 实 质 都 
是 相 类 似 的 。 比 如 C# 中 ， 字 符 串 操作 就 还 有 ToLower 转 小 写 、ToUpper 
转 大 写 、Im-dexOf 从 左 碍 找 子 串 位 置 〈 操 作 名 有 修改 ) 、LastIndexOf 从 
右 碍 找 子 串 位 置 、Trim 去 除 两 边 空 格 等 比较 方便 的 操作 ， 它 们 其 实 就 是 














前 面 这 些 基 本 操作 的 扩展 函数 。 


我 们 来 看 一 个 操作 Index 的 实现 算法 。 








/* TREZE. SESH post +4 AEST 
HERTE, */ 
/* 则 返回 第 一 个 这 样 的 子 串 在 S 中 的 位 置 ， 否 则 返 
Ee */ 

int Index(String S, String T, int pos) 
í 












































ale iy, m abe 
String sub; 
if (pos > 0) 


/* 得 到 主 串 S 的 长 度 */ 

n = StrLength(S); 

/* 得 到 子 串 T 的 长 度 */ 

m = StrLength(T); 

i = pos; 

while (i <= n - m+ 1) 


{ 





/* 取 主 串 第 i 个 位 置 */ 

/* 长 度 与 T 相 等 子 串 给 sub */ 
SübString sub, om 

/* 如 果 两 串 不 相等 */ 

if (StrCompare(sub, T) != 0) 

































































AF 
/* 如 果 两 串 相 等 */ 
else 
/* 则 返回 i 值 */ 
return i; 
} 
} 
/* 若 无 子 串 与 T 相 等 ， 返 回 9 */ 
return 0; 


当 中 用 到 了 StrLength、SubString、StrCom-pare 等 基本 操作 来 容 現 。 


5.5 串 的 存储 结构 
串 的 存储 结构 与 线性 表 相 同 ， 分 为 两 种 。 
5.5.1 串 的 顺序 存储 结构 


串 的 顺序 存储 结构 是 用 一 组 地 址 连续 的 存储 单元 来 存储 串 中 的 字符 序列 
的 。 按 照 预 定义 的 大 小 ， 为 每 个 定义 的 串 变 量 分 配 一 个 固定 长 度 的 存储 
区 。 一 般 是 用 定 长 数组 来 定义 。 


既然 是 定 长 数组 ， 束 存在 一 个 预定 义 的 最 大 串 长 度 ， 一 般 可 以 将 实际 的 
串 长 度 值 保 存在 数组 的 0 下 标 位 置 ， 有 的 书 中 也 会 定义 存储 在 数组 的 最 
后 一 个 下 标 位 置 。 但 也 有 些 编程 语言 不 想 这 么 干 ， 沉 得 存 个 数字 占 个 空 
APRIL. “ERNE TE EB ES TAA IRE Rid FTF, 比 
如 “%\0? 来 表示 串 值 的 终结 ， 这 个 时 候 ， 你 要 想 知 道 此 时 的 串 长 度 ， 就 需 
要 电 有 历 计算 一 下 才 知 道 了 ， 其 实 这 还 是 需要 占用 一 个 空间 ， 何 必 呢 。 




















数组 的 长 度 MaxSize 


图 5-5-1 








刚才 讲 的 串 的 顺序 存储 方式 其 实 是 有 问题 的 ， 因 为 字符 串 的 操作 ， 比 如 
两 串 的 连接 Concat、 新 串 的 插入 StrInsert， 以 及 字符 串 的 替换 Replace， 
都 有 可 能 使 得 串 序列 的 长 度 超过 了 数组 的 长 度 Max-Size。 








a LE et 手机 发 短信 时 ， 运 营 商 规定 每 条 短信 限制 70 个 
。 大 约 八 年 前 ， 我 的 手机 每 当 我 写 了 超过 70 个 字 后 ， 它 就 提示 “短信 
过 长 请 删 减 后 重 发 。” 后 来 我 换 了 一 个 手机 后 再 没有 这 样 见 鬼 的 提示 
JT: RRAN., 一 次 ， 因为 一 点 小 矛盾 需要 向 当时 的 女友 解释 一 下 ， 我 
准备 发 一 条 短信 ， 一 共 打 了 79 个 字 。 最 后 的 部 分 字 实 际 是 “...... 只 会 说 
好 上 听 的 话 ， 像 我 恨 你 :这 种 话 是 不 可 能 说 的 "。 点 发 送 。 后 来 得 知 对 方 收 
al, RA, SABE... RSH, BRR” 
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只 是 因为 我 上 班 时 被 老板 
=. DEREBA, MAE 
和 你 约会 时 就 说 了 一 些 不 
该 说 的 话 ， 就 算 要 说 ,也 
只 会 说 好 听 的 话 ， 像 "我 恨 


iat Ii 返回 


图 5-5-2 


有 这 样 截断 的 吗 ? 我 后 来 知道 这 个 情况 后 ， 恨 不 得 把 手机 古 了 。 显 然 ， 
无 论 是 上 湾 提 示 报 错 ， 还 是 对 多 出 来 的 字符 串 截 尾 ， 都 不 是 什么 好 办 
法 。 但 字符 串 操作 中 ， 这 种 情况 比比 篆 是 。 














于 是 对 于 串 的 顺序 存储 ， 有 一 些 变 化 ， 串 值 的 存储 空间 可 在 程序 执行 过 
程 中 动态 分 配 而 得 。 比 如 在 计算 机 中 存在 一 个 自由 存储 区 ， 叫 做 * 推 ?。 
这 个 堆 可 由 C 语 言 的 动态 分 配 函 数 mallocO0 和 free(0) 来 管理 。 


5.5.2 ” 串 的 链 式 存储 结构 


对 于 捉 的 链 式 存储 结构 ， 与 线性 表 是 相似 的 ， 但 由 于 串 结 构 的 特殊 性 ， 
结构 中 的 每 个 元 素数 据 是 一 个 字符 ， 如 果 也 简单 的 应 用 链表 存储 串 值 ， 
一 个 结 反对 应 一 个 字符 ， 束 会 存在 很 大 的 空间 浪费 。 因 此 ， 一 个 结 点 可 
以 存放 一 个 字符 ， 也 可 以 考虑 存放 多 个 字 特 ， 最 后 一 个 结 反 硅 是 未 被 占 
满 时 ， 可 以 用 只 #* 或 其 他 非 串 值 字符 补 全 ， 如 图 5-5-3 所 示 。 














图 5-5-3 





当然 ， 这 里 一 个 结 点 存 多 少 个 字符 才 合 适 束 变 得 很 重要 ， 这 会 直接 影响 
者 串 处 理 的 效率 ， 需 要 根据 实际 情况 做 出 选择 。 











但 串 的 链 式 存储 结构 除了 在 连接 串 与 串 操 作 时 有 一 定 方便 之 外 ， 总 的 来 
说 不 如 顺序 存储 灵活 ， 性 能 也 不 如 顺序 存储 结构 好 。 


5.6” 朴 聂 的 模式 匹配 算法 


EDN ri 2e bel BE EER MAC EB Bo UCI 
才 发 现 学 习 英 语 不 只 是 为 了 过 四 六 级 ， 工 作 中 它 还 是 挺 重要 的 。 而 我 那 
FUME ARR HCA KANE So Tre RA te RIN E AR oe 
ー ト , RHE, FRAN LITO A ETT AINE. RAHA 
AAG IN, Bb eT RACER PH, TERME a OY “Me 
序 ， 只 要 输入 一 些 英 文 的 文档 ， 就 可 以 计算 出 这 当中 所 用 频率 最 高 的 词 
汇 是 哪些 。 把 它们 都 背 好 了 ， 基 本 上 阅读 也 就 不 成 问题 了 。 

















当然， 说 说 容易 ， 要 实现 这 一 需求 ， 当 中 会 有 很 多 困难 ， 有 兴趣 的 同 
学 ， 不 妨 去 试 试看 。 不 过 ， 这 里 面 最 重要 其 实 就 是 去 找 一 个 单词 在 一 篇 
文章 《相当 于 一 个 大 字符 哩 ) 中 的 定位 问题 。 这 种 子 串 的 定位 操作 通 各 
称 做 串 的 模式 匹配 ， 应 该 算是 串 中 最 重要 的 操作 之 一 。 











假设 我 从 ] 要 从 下 面 的 主 串 S="goodgoogle" 中 ， 找 到 T="google" 这 个 子 串 
的 位 置 。 我 们 通常 需要 下 面 的 步 又 。 








L. BERSAMA, SITHA ERARD, SANNE 
d 而 了 的 是 g。 第 一 位 匹配 失败 。 如 图 5-6-1 所 示 ， 其 中 竖 直 连 线 表示 相 
S, WERE MERRIE. 





图 5-6-1 








2. 主 串 S 第 二 位 开始 ， 主 串 S$ 首 字母 是 o， 要 匹配 的 T 首 字母 是 g， 匹 配 
失败 ， 如 图 5-6-2 所 示 。 





图 5-6-2 








3. 主 串 S 第 三 位 开始 ， 主 串 S$ 首 字母 是 o， 要 匹配 的 T 首 字母 是 g， 匹 配 
失败 ， 如 图 5-6-3 所 示 。 





图 5-6-3 








4. 主 串 S 第 四 位 开始 ， 主 串 S$ 首 字母 是 4， 要 匹配 的 T 首 字母 是 g， 匹 配 
失敗 , 如 図 5-6-4 所 示 。 





主 串 S$ 第 五 位 开始 ，$ 与 T，6 个 字母 全 匹配 ， 匹 配 成 功 ， 如 图 5-6-5 所 
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图 5-6-5 


简单 的 说 ， 就 是 对 主 串 的 每 一 个 字符 作为 子 串 开头 ， 与 要 匹配 的 字符 哩 
进行 匹配 。 对 主 串 做 大 循环 ， 每 个 字符 开头 做 T 的 长 度 的 小 循环 ， 直 到 
匹配 成 功 或 全 部 过 历 完成 为 止 。 


前 面 我 们 已 经 用 串 的 其 他 操作 实现 了 模式 匹配 的 算法 Index。 现 在 考虑 
不 用 串 的 其 他 操作 ， 而 是 只 用 基本 的 数组 来 实现 同样 的 算法 。 注 意 我 们 
假设 主 串 S 和 要 匹配 的 子 串 工 的 长 度 存在 S[0] 与 T[0] 中 。 实 现代 码 如 下 : 








/* 返回 子 串 T 在 主 串 S 中 第 pos 个 字符 之 后 的 位 置 。 
若 不 存在 ， 则 函数 返回 值 为 9。 */ 

/* Tia: 1spossStrLength(S) 。 */ 

nme Dm dex (SIIN GIS String ly un os 
{ 



































/* 主 用 于 主 串 S 中 当前 位 置 下 标 ， 若 pos 不 为 1 */ 
/* 则 从 pos 位 置 开始 匹配 */ 

int i = pos; 
/* j 用 于 子 串 T 中 当前 位 置 下 标 值 */ 
Elite] eels 
/* 若 i 小 于 S 长 度 且 j 小 于 T 的 长 度 时 循环 */ 
while (i <= S[O] && j <= T[0]) 

{ 
















































































/* 两 字母 相等 则 继续 */ 
HUECS EN an ay) 
{ ` 

++1; 

stud les 





} 
/* 指针 后 退 重 新 开始 匹配 */ 


else 























/* 退回 到 上 次 匹配 首位 的 下 一 位 */ 
is ees pe 

Po pls 
j 




















; 
退回 到 子 串 T 的 首位 */ 

















} 
if (j = TI9]) 
return i - TOI 
else 
return 0; 


分 析 一 下 , 最 好 的 情況 走 仕 久 ? 那 就 是 一 开始 就 区 配 成 功 ， 比 
如 “googlegood" 中 去 找 “google"”， 时 间 复 杂 度 为 0(1)。 稍 差 一 些 ， 如 果 像 





刚才 例子 中 第 二 、 三 、 四 位 一 样 ， 每 次 都 是 首 字母 就 不 匹配 ， 那 么 对 T 
串 的 循环 就 不 必 进 行 了 ， 比 如 “abcdef-google” 中 去 找 “google”。 那 么 时 
间 复 杂 度 为 O(n+m)， 其 中 n 为 主 串 长 度 ，m 为 要 罗 配 的 子 串 长 度 。 根 据 
等 概率 原则 ， 平 均 是 n+m)]/2 次 查找 ， 时 间 复 杂 度 为 On+m)。 











那么 最 坏 的 情况 又 是 什么 ?就 是 每 次 不 成 功 的 匹配 都 发 生 在 串 工 的 最 后 
一 个 字符 。 举 一 个 很 极端 的 例子 。 主 串 为 
S="00000000000000000000000000000000000000000000000001"， 而 要 匹 
配 的 子 串 为 T="0000000001"， 前 者 是 有 49 个 “0” 和 1 个 “1” 的 主 串 ， 后 者 
是 9 个 “0” 和 1 个 “1” 的 子 串 。 在 匹配 时 ， 每 次 都 得 将 TT 中 字符 循环 到 最 后 
一 位 才 发 现 : 哦 ， 原 来 它们 是 不 匹配 的 。 这 样 等 于 TIT 串 需要 在 S 串 的 前 40 
个 位 置 都 需要 判断 10 次 ， 并 得 出 不 匹配 的 结论 ， 如 图 5-6-6 所 示 。 
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TES AEA TORRE PALE 储 第 一 位 置 再 次 判断 了 [0 次 发 现 字符 未 不 世 配 


图 5-6-6 


直到 最 后 第 41 个 位 置 ， 因 为 全 部 匹配 相等 ， 所 以 不 需要 再 继续 进行 下 
去 ， 如 图 5-6-7 所 示 。 如 果 最 终 没有 可 匹配 的 子 串 ， 比 如 是 
T="0000000002"， 到 了 第 41 位 置 判 断 不 匹配 后 同样 不 需要 继续 比 对 下 
去 。 因 此 最 坏 情 况 的 时 间 复 杂 度 为 O((n-m 十 1)*m)。 
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期 间 进行 了 (50-101) x10 次 判断 操作 





图 5-6-7 


不 要 以 为 我 这 只 是 危 言 答 听 ， 在 实际 运用 中 ， 对 于 计算 机 来 说 ， 处 理 的 
都 是 二 进位 的 0 和 1 的 串 ， 一 个 字符 的 ASCII 码 也 可 以 看 成 是 8 位 的 二 进位 
01 串 ， 当 然 ， 汉 字 等 所 有 的 字符 也 都 可 以 看 成 是 多 个 0 和 1 组 成 的 串 。 再 
比如 像 计 算 机 图 形 也 可 以 理解 为 是 由 许 许 多 多 个 0 和 1 的 串 组 成 。 所 以 在 
计算 机 的 运算 当中 ， 模 式 匹 配 操 作 可 说 是 随处 可 见 ， 而 刚才 的 这 个 算 
法 ， 就 显得 太 低 效 了 。 

















5.7 KMP 模 式 匹 配 算法 


你 们 可 以 忍受 朴素 模式 匹配 算法 的 低 效 吗 ? 也 许 不 可 以 、 也 许 无 所 谓 。 
但 在 很 多 年 前 我 们 的 科学 家 们 ， 沉 得 像 这 种 有 多 个 0 和 1 重复 字符 的 字符 
串 ， 模 式 匹 配 需要 挨个 志 历 的 算法 是 非常 糟糕 的 。 于 是 有 三 位 前 奉 ， 
D.E. Knuth, J.H. Morris 和 V.R. Pratt ( 其 中 Knuth 和 Pratt 共 同 研究 , Mor- 
ris 独 立 研究 ) 发 表 一 个 模式 匹配 算法 ， 可 以 大 大 避免 重复 遇 历 的 情况 ， 
我 们 把 它 称 之 为 克 努 特 一 英里 斯 一 普 拉 特 算法 ， 人 简称 KMP 算 法 。 








5.7.1 KMPE 模 式 匹 配 算法 原理 


为 了 能 讲 清楚 KMP 算 法 ， 我 们 不 直接 讲 代码 ， 那 样 很 容易 造成 理解 困 
难 ， 还 是 从 这 个 算法 的 研究 角度 来 理解 为 什么 它 比 朴素 算法 要 好 。 


如 果 主 串 S="abcdefgab"， 其 实 还 可 以 更 长 一 些 ， 我 们 就 省 略 挥 只 保留 前 
9 位 ， 我 们 要 匹配 的 T="abcdex"， 那 么 如 果 用 前 面 的 朴素 算法 的 话 ， 前 5 
两 个 串 完全 相等 ， 直 到 第 6 个 字母 ，“f” 与 “x” 不 等 ， 如 图 5-7-1 
DATARS © 







































































图 5-7-1 


接 下 来 ， 按 照 朴 素 模式 匹配 算法 ， 应 该 是 如 图 5-7-1 的 流程 CGO。 
即 主 串 S 中 当 i=2、3、4、5、6 时 ， 首 字符 与 子 串 T 的 首 字 符 均 不 等 。 


似乎 这 也 是 理所当然 ， 原 来 的 算法 就 是 这 样 设计 的 。 可 仔细 观察 发 现 。 
对 于 要 匹配 的 子 串 T 来 说 , “abcdex” 首 字母 “a” 与 后 面 的 串 “bcdex” 中 任意 
一 个 字符 都 不 相等 。 也 就 是 说 ， 既 然 “a” 不 与 目 己 后 面 的 子 串 中 任何 一 
字符 相等 ， 那 么 对 于 图 5-7-1 的 也 来 说 ， 前 五 位 字符 分 别 相 等 ， 意 味 着 子 
串 T 的 首 字符 “a” 不 可 能 与 S 串 的 第 2 位 到 第 5 位 的 字符 相等 。 在 图 5-7-1 
F, DODOM ELR. 











注意 这 里 是 理解 KMP 算 法 的 关键 。 如 果 我 们 知道 T 串 中 首 字 符 “a” 与 工 中 
后 面 的 字符 均 不 相等 (注意 这 是 前 提 ， 如 何 判 断后 面 再 讲 ) 。 而 Tf 串 的 
第 二 位 的 “b” 与 S 串 中 第 三 位 的 “b”* 在 图 5-7-1 的 中 己 经 判断 是 相等 的 ， 
那么 也 就 意味 着 ， 工 串 中 首 字符 “a” 与 S 串 中 的 第 二 位 “b”* 是 不 需要 判断 也 
知道 它们 是 不 可 能 相等 了 ， 这 样 图 5-7-1 的 @ 这 一 步 判 断 是 可 以 省 略 的 ， 
如 图 5-7-2 所 示 。 





ooa 


TH RETES 因此 当 T 位 于 第 二 位 置 的 
wT ATP], TS] 判断 就 根本 不 需要 进行 了 
图 5-7-2 


同样 道理 ， 在 我 们 知道 T 串 中 首 字符 “a” 与 T 中 后 面 的 字符 均 不 相等 的 前 
提 下 ，T 串 的 “a” 与 S 串 后 面 的 “c*、“d”、“e” 也 都 可 以 在 Q@ 之 后 就 可 以 确 
定 走 不 相 等 的 , 所 以 返 人 算法 当 中 ②③⑨⑤ 没 有 必 要 , 具 保 留 ①⑥ 即 
By, 如 図 5-7-3 所 示 。 























之 所 以 保留 @ 中 的 判断 是 因为 在 中 中 T[6]<S[6]， 尽 管 我 们 已 经 知道 
T[1]zxT[6]， 但 也 不 能 断定 T[1] 一 定 不 等 于 S[6]， 因 此 需要 保留 @ 这 一 


BD 


有 人 就 会 问 ， 如 果 T 串 后 而 也 含有 首 字符 “a” 的 字符 怎么 办 呢 ? 


我 们 来 看 下 面 一 个 例子 ， 假 设 S="abcababca"，T="abcabx"。 对 于 开始 的 
判断 ， 前 5 个 字符 完全 相等 ， 第 6 个 字符 不 等 ， 如 图 5-7-4 的 中。 此 时 ， 根 
据 刚 才 的 经 验 ，T 的 首 字符 “a” 与 T 的 第 二 位 字符 “b”、 第 三 位 字符 “c” 均 
不 等 ， 所 以 不 需要 做 判断 ， 图 5-7-4 的 朴素 算法 步骤 @@ 都 是 多 余 。 















































图 5-7-4 


因为 了 的 首位 “a” 与 T 第 四 位 的 “a” 相 等 ， 第 二 位 的 “b” 与 第 五 位 的 “b” 相 
等 。 而 在 WW 时 ， 第 四 位 的 “a” 与 第 五 位 的 “b” 已 经 与 主 串 S 中 的 相应 位 置 
比较 过 了 ， 是 相等 的 ， 因 此 可 以 断定 ，T 的 首 字 符 “a”、 第 二 位 的 字 

符 “b” 与 的 第 四 位 字符 和 第 五 位 字符 也 不 需要 比较 了 ， 肯 定 也 是 相等 的 
之 前 比较 过 了 ， 还 判断 什么 ， 所 以 加 这 两 个 比较 得 出 字符 相等 的 
步骤 也 可 以 省 略 。 








也 就 是 次， 对 于 在 子囊 中 有 与 首 字 符 相 等 的 字符 ， 也 是 可 以 省 略 一 部 分 
不 必要 的 判断 步骤 。 如 图 5-7-5 所 示 ， 省 略 掉 右 图 的 T 串 前 两 
位 “a” 与 “b” 同 S 串 中 的 4、5 位 置 字 符 风 配 操作 。 














图 5-7-5 


对 比 这 两 个 例子 ， 我 们 会 发 现在 时 ， 我 们 的 i 值 ， 也 就 是 主 串 当前 位 
置 的 下 标 是 6，@@@,， i 值 是 2-、3、4、5， 到 了 @@，i 值 才 又 回 到 了 
6。 即 我 们 在 朴素 的 模式 匹配 算法 中 ， 主 串 的 i 值 是 不 断 地 回溯 来 完成 
的 。 而 我 们 的 分 析 发 现 ， 这 种 回溯 其 实 是 可 以 不 需要 的 一 一 正 所 谓 好 马 
RE 








既 然 i 債 不 回 湖 , thaitze AAT AE, 那 久 要 考 虐 的 変化 就 療 j 値 了 。 通 
过 观察 也 可 发 现 ， 我 们 屡屡 提 到 了 T 串 的 首 字符 与 目 身 后 面 字 符 的 比 

较 ， 发 现 如 果 有 相等 字符 ，j 值 的 变化 就 会 不 相同 。 也 就 是 说 ， 这 个 j 值 
的 变化 与 主 串 其 实 没什么 关系 ， 关 键 残 取决 于 T 串 的 结构 中 是 否 有 重复 


的 问题 。 


























比如 图 5-7-3 中 ， 由 于 T="abcdex"， 当 中 没有 任何 重复 的 字符 ， 所 以 j 就 
由 6 变 成 了 1。 而 图 5-7-5 中 ， 由 于 T="abcabx"， 前 级 的 “ab” 与 最 后 “x” 之 
前 串 的 后 缀 “ab* 是 相等 的 。 因 此 j 就 由 6 变 成 了 3。 因 此 ， 我 们 可 以 得 出 规 
律 ，j 值 的 多 少 取决 于 当前 字符 之 前 的 串 的 前 后 缀 的 相似 度 。 





我 们 把 I 串 各 个 位 置 的 j 值 的 变化 定义 为 一 个 数组 next， 那 么 next 的 长 度 
就 是 T 串 的 长 度 。 于 是 我 们 可 以 得 到 下 面 的 函数 定义 : 





0 た 前 
next{iJ= 4Max {KIA Ep A pA 由 此 集合 不 空 时 
|, 其 他 情况 


5.7.2 next 数组 值 推导 


具体 如 何 推导 出 一 个 串 的 next 数 组 值 呢 ， 我 们 来 看 一 些 例子 。 


1. T="abcdex" ( 如 表 5-7-1 所 示 ) 


表 5-7-1 


j 123456 


模式 串 T abcdex 
next[jj 011111 


1) 当 j=1 时 ，next[1]=0; 


2) 当 j=2 时 ，j 由 1 到 j-1 就 只 有 字符 “a”*”， 属 于 其 他 情况 next[2]=1; 


3) 当 j=3 时 ，j 由 1 到 j-1 串 是 “ab”， 显 然 “a” 与 <b" 不 相等 ， 属 其 他 情况 ， 
next[3]=1; 


4) 以 后 同 理 ， 所 以 最 终 此 T 串 的 next[j] 为 011111。 
2. T="abcabx" ( 如 表 5-7-2 所 示 ) 


表 5-7-2 


] 123456 
模式 串 T abcabx 
nextlj| 011123 


1) 当 に 1 時 , next[1]=0; 

2) 当 j=2 时 ， 同 上 例 说 明 ，next[2]=1:; 
3) 当 j=3 时 ， 同 上 ，next[3]=1; 

4) 当 j=4 时 ， 同 上 ，next[4]=1; 


5) 当 j=5 时 ， 此 时 j 由 1 到 j-1 的 串 是 “abca*， 前 级 字符 “a” 与 后 级 字符 “a” 相 
等 (前 级 用 下 划 线 表示 ， 后 级 用 冬 体 表示 〉 ， 因 此 可 推算 出 k 值 为 
2 《由 pi.…pk1 =Pjk+1…Pj-1， 得 到 p1=pa〉 因 此 next[5]=2; 


6) 当 j=6 时 ，j 由 1 到 j-1 的 串 是 “abcab”， 由 于 前 级 字 符 “ab” 与 后 级 “ab” 相 
等 ， 所 以 next[6]=3。 








我 们 可 以 根据 经 验 得 到 如 果 前 后 级 一 个 字符 相等 ，k 值 是 2， 两 个 字符 k 
值 是 3，n 个 相等 k 值 就 是 n+1。 


3. T="ababaaaba" ( 如 表 5-7-3 所 示 ) 


表 5-7-3 


j 123456789 


模式 串 T ababaaaba 
next[j] 011234223 


1) 当 j=1 时 ，next[1]=0; 


2) 当 j=2 时 ， 同 上 next[2]=1; 


3) 当 に 3 時, 同上 next[3]=1. 


4) 当 j=4 时 ，j 由 1 到 j-1 的 串 是 <aba*， 前 级 字符 “a” 与 后 级 字符 “a” 相 等 ， 
next[4]=2; 


5) zj- o, j 由 1 到 j-1 的 串 是 “abab”， 由 于 前 级 字符 “ab” 与 后 缀 “ab” 相 
等 ， 所 以 next[5]=3; 


6) 当 j=6 时 ，j 由 1 到 j-1 的 串 是 “ababa”， 由 于 前 缀 字符 “aba” 与 后 
鱗 “aba” 相 等 , 所 以 next[6]=4: 


7) 当 j=7 时 ，j 由 1 到 j-1 的 串 是 “ababaa”， 由 于 前 缀 字符 “ab” 与 后 级 “aa”》 
不 相等 ， 只 有 “a” 相 等 ， 所 以 next[7]=2; 


8) 当 j=8 时 ，j 由 1 到 j-1 的 串 是 “ababaaa”， 只 有 “a” 相 等 ， 所 以 next[8]=2; 


9) 当 j=9 时 ，j 由 1 到 j-1 的 串 是 “ababaaab”， 由 于 前 级 字符 “ab” 与 后 
级 “ab” 相 等 ， 所 以 next[9]=3。 


4. T="aaaaaaaab" ( 如 表 5-7-4 所 示 ) 


表 5-7-4 


j 123456789 
模式 串 T aaaaaaaab 
next[j] 012345678 


1) “4j=1IN, next[1]=0: 


2) 当 に 2 時 , 同上 next[2]=1. 


3) 当 j=3 时 ，j 由 1 到 j-1 的 串 是 “aa”， 前 级 字符 “a” 与 后 级 字符 “a” 相 等 ， 
next[3]=2; 


4) 当 j=4 时 ，j 由 1 到 j-1 的 串 是 “aaa”， 由 于 前 绥 字 符 “aa" 与 后 绥 “aa” 相 
等 ， 所 以 next[4]=3; 


6) 当 j=9 时 ，j 由 1 到 j-1 的 串 是 “aaaaaaaa”， 由 于 前 缀 字符 “aaaaaaa"” 与 后 
缀 “aaaaaaa” 相 等 ， 所 以 next[9]=8。 


5.7.3 ”天 MP 模式 匹配 算法 实现 


说 了 这 么 多 ， 我 们 可 以 来 看 看 代码 了 。 











/* 通过 计算 返回 子 串 T 的 next 数 组 。 */ 
void get_next(String T, int *next) 






































ees 
ne ape 
ale Sale 
y= 
next[1] = 6: 
/* 此 处 T[9] 表 示 串 T 的 长 度 */ 
while (i < T[0]) 
/* T[ 订 表示 后 绥 的 单个 字符 ， */ 
Le TJ] RAAT he PA 
it (QOS AU 
EEI; 
++); 
next[i] = j; 
else 
/* 若 字 符 不 相同 ， 则 j 值 回溯 */ 
j = next[]] 
} 
} 


EUS IY BE A S i i SA ACY BT next B24 








/* 返回 子 串 T 在 主 串 S 中 第 pos 个 字符 之 后 的 位 置 。 
若 不 存在 ， 则 函数 返回 值 为 90。 */ 
Wlsnos<Sstrienge(es ye 

int Index_KMP(String S, String T, int pos) 
{ 









































/* iff 主 串 S 当 前 位 置 下 标 值 ， 车 Pos 不 为 1， */ 
/* 则 从 pos 位 置 开始 匹配 */ 

int i = pos; 
/* j 用 于 子 串 T 中 当前 位 置 下 标 值 */ 

nie oh ale 

/* wES—next HZ */ 

int next[255]; 

/* 对 串 T 作 分 析 ， 得 到 next 数 组 */ 
get_next(T, next); 

/* 若 1 小 干 S 的 其 度 且 ] 小 干 T 的 民度 時 , */ 
/* 循环 继续 */ 

while (i <= S[0] && j <= T[9] ) 


/* 两 字母 相等 则 继续 ， 相 对 于 朴素 算法 增加 了 */ 

























































































/* j=0 判 断 */ 

G= e Se E 
++i; 
二 





} 
/* 指针 后 退 重 新 开始 匹配 */ 




















else 

{ 
/* j 退 回合 适 的 位 置 ，i 值 不 变 */ 
eX 

} 


O > lO 
returnere HO 
else 
return 0; 


DUAL A AE PAD a VOC SET ORS, 改 効 不 算 大 , KEK TH 
了 i 值 回潮 的 部 分 。 对 于 get_next 函 数 来 说 ， 寿 TT 的 长 度 为 m， 因 只 涉及 到 
简单 的 单 循环 ， 其 时 间 复 杂 度 为 O(m)， 而 由 于 i 值 的 不 回 滴 ， 使 得 
index_KMP 算 法 效率 得 到 了 提高 ，while 循 环 的 时 间 复 杂 度 为 O(n)。 
此 ， 整 个 算法 的 时 间 复 杂 度 为 On 十 m)。 相 较 于 朴素 模式 匹配 算法 的 
O((n-m+1)*m) 来 说 ， 是 要 好 一 些 。 








这 里 也 需要 强调 ，KMP 算 法 仅 当 模式 与 主 串 之 间 存 在 许多 “部 分 匹配 ”的 
情况 下 才 体现 出 它 的 优势 ， 否 则 两 者 差异 并 不 明显 。 


5.7.4 和 MP 模式 匹配 算法 改进 


后 来 有 人 发 现 ，KMP 还 是 有 缺陷 的 。 比 如 ， 如 果 我 们 的 主 串 
S="aaaabcde"， 子 串 T="aaaaax"， 其 next 数 组 值 分 别 为 012345， 在 开始 
时 ， 当 i=5、j=5 时 ， 我 们 发 现 “b” 与 “a”* 不 相等 ， 如 图 5-7-6 的 OD， 因 此 
j=next[5]=4， 如 图 中 的 @@， 此 时 “b” 与 第 4 位 置 的 “a” 依 然 不 等 ， 
j=next[4]=3， 如 图 中 的 @®， 后 依次 是 9， 直到 j=next[1]=0 时 ， 根 据 算 
法 ， 此 时 i++、j++， 得 到 i=6、j=1， 如 图 中 的 @@。 




















图 5-7-6 


RIEM, 当 中 的 ②③④⑤ 歩 張 , HKESRHAM. AFTRA 
一 、 三 、 四 、 五 位 置 的 字符 都 与 首位 的 “a” 相 等 ， 那 么 可 以 用 首位 
next[1] 的 值 去 取代 与 它 相 等 的 字符 后 续 next[j] 的 值 ， 这 是 个 很 好 的 办 
法 。 因 此 我 们 对 求 next 函 数 进 行 了 改 民 。 





假设 取代 的 数组 为 nextval， 增 加 了 加 粗 部 分 ， 代 码 如 下 : 





/* 求 模式 串 T 的 next 函 数 修正 值 并 存 入 数组 
nextval */ 
void get_nextval(String T, int *nextval) 











ime al y 
al al 
= 205 


nextval[1] = 0; 

/* 此 处 T[9] 表 示 串 T 的 长 度 */ 
while (i < T[0]) 

{ 





/* T[ 并 ] 表 示 后 级 的 单个 字符 ， */ 
/* T[j] 表 示 前 缀 的 单个 字符 */ 
‘ (j == © || T[i] == T[j] ) 








aoe 
attr 
/* 若 当前 字符 与 前 绥 字 符 不 同 */ 
if (T[i] != T[]]) 
/* 则 当前 的 j 为 nextval 在 i 位 置 的 值 */ 
nextval[i] = j; 
else 














/* 如 果 与 前 级 字符 相同 ， 则 将 前 级 */ 
/* 字符 的 nextval 值 赋值 给 nextval 在 i 位 置 的 值 */ 
nextval[i] = nextval[j]; 





























} 


else 
/* 若 字 符 不 相同 ， 则 j 值 回溯 */ 
j = nextval[j]; 








实际 匹配 算法 ， 只 需要 将 “get_next(Tinexb;” 改 为 “get_nextval(T,nexb;>” 即 
可 ， 这 里 不 再 重复 。 


5.7.5 ”nextval 数 组 值 推导 

改良 后 ， 我 们 之 前 的 例子 nextval 值 就 与 next 值 不 完全 相同 了 。 比 如 : 
1. T="ababaaaba" ( 如 表 5-7-5 所 示 ) 

表 5-7-5 

j 123456789 

模式 串 T ababaaaba 


nextl]] 011234223 
nextval[j] 010104210 


先 算 出 next 数 组 的 值 分 别 为 011234223， 然 后 再 分 别 判断 。 


1) 当 j=1 时 ，nextval[1]=0; 


2) 当 j=2 时 ， 因 第 二 位 字符 “b” 的 next 值 是 1， 而 第 一 位 就 是 “a”， 它 们 不 
相等 ， 所 以 nextval[2]=next[2]=1， 维 持原 值 。 


3) 当 j=3 时 ， 因 为 第 三 位 字符 “a” 的 next 值 为 1， 所 以 与 第 一 位 的 “a” 比 较 
得 知 它们 相等 ， 所 以 nextval[3]=nextval[1]=0; 如 图 5-7-7 所 示 。 


此 数 是 1， 因 此 查看 T[1] 
与 本 位 置 的 T[3] 是 否 相 等 





HATETE], MY 
nextval[3]=nextval[1]=0 


图 5-7-7 


4) 当 j=4 时 ， 第 四 位 的 字符 “b”next 值 为 2， 所 以 与 第 二 位 的 “b” 相 比较 得 
到 结果 是 相等 ， 因 此 nextval[4]=nextval[2]=1; 如 图 5-7-8 所 示 。 


LL es 


next 


图 5-7-8 


5) 当 j=5 时 ，next 值 为 3， 


nextval[5]=nextval[3]=0; 





ID seen EAH 


nextval ER 
| Se 


KATRA], Prt 


nextval[4]=nextval[2]=1 


第 五 个 字符 "a* 与 第 三 个 字符 "a" 相 等 ， 因 此 





6) 当 j=6 时 ，next 值 为 4， 


nextval[6|=4; 


7) 4j=7IN, next 僅 2, 


nextval[7|=2; 


8) 当 に 8 時 , next{ X2, 


nextval[8]=nextval[2]=1; 


第 六 个 字符 “a” 与 第 四 个 字符 “b”* 不 相等 ， 因 此 


第 七 个 字符 “a” 与 第 二 个 字符 “b” 不 相等 ， 因 此 


第 八 个 字符 “b” 与 第 二 个 字符 “b” 相 等 ， 因 此 


9) 当 j=9 时 ，next 值 为 3， 第 九 个 字符 “a” 与 第 三 个 字符 “a” 相 等 ， 因 此 
nextvall9|=nextval[3| に 0 。 


2. T="aaaaaaaab" ( 如 表 5-7-6) 
表 5-7-6 

j 123456789 
模式 串 T aaaaaaaab 


next[j] 012345678 
nextval[j] 000000008 


先 算出 next 数 组 的 值 分 别 为 012345678， 然 后 再 分 别 判 断 。 
1) 当 j=1 时 ，nextval[1]=0; 


2) 当 j=2 时 ，next 值 为 1， 第 二 个 字符 与 第 一 个 字符 相等 ， 所 以 
nextval|2|=nextval[1]=0; 


3) 同样 的 道理 ， 其 后 都 为 0.……; 


4) 当 j=9 时 ，next 值 为 8， 第 九 个 字符 “b” 与 第 八 个 字符 “a”* 不 相等 ， 所 以 
nextval[9]=8。 


总 结 改 进 过 的 KMP 算 法 ， 它 是 在 计算 出 next 值 的 同时 ， 如 果 a 位 字符 与 
它 next 值 指向 的 b 位 字符 相等 ， 则 该 a 位 的 nextval 就 指向 b 位 的 nextval 值 ， 
如 果 不 等 ， 则 该 a 位 的 nextval 值 就 是 它 自 己 a 位 的 next 的 值 。 





5.8 总 结 回顾 





这 一 章节 我 们 重点 讲 了 * 串 ”这 样 的 数据 结构 ， 串 《string) 是 由 零 个 或 多 
个 字符 组 成 的 有 限 序 列 ， 又 名 叫 字符 串 。 本 质 上 ， 它 是 一 种 线性 表 的 扩 
展 ， 但 相对 于 线性 表 关 注 一 个 个 元 系 来 说 ， 我 们 对 串 这 种 结构 更 多 的 是 
关注 它 子 串 的 应 用 问题 ， 如 查找 、 谷 换 等 操作 。 现 在 的 高 级 语言 都 有 针 
对 串 的 函数 可 以 调用 。 我 们 在 使 用 这 些 函 数 的 时 候 ， 同 时 也 应 该 要 理解 
它 当 中 的 原理 ， 以 便于 在 碰 到 复杂 的 问题 时 ， 可 以 更 加 灵活 的 使 用 ， 比 
如 KMP 模 式 匹 配 算 法 的 学 习 ， 就 是 更 有 效 地 去 理解 ndex 函 数 当 中 的 实 
说 不 定 有 一 天 ， 可 以 有 以 你 的 名 字 命 名 的 算法 流 














5.9 结尾 语 








在 我 们 这 一 章 的 开头 ， 我 已 经 提 到 了 回 文 许 ， 其 实 那 一 首 只 能 算是 写 得 
还 不 错 而 已 。 回 文 诗 在 我 们 中 国 古 代 有 不 少 ， 不 过 当中 有 一 组 ， 严 格 来 
说 是 有 一 幅 图 ， 却 是 被 公认 为 是 最 强 的 回 文 诗 一 一 那 就 是 《 歼 丽 图 》。 





相传 《 璇 现 几 》 是 前 秦 才 女 苏 若 兰 因 其 丈夫 遭 人 迫害 ， 发 配 别 处 服 苦 

役 ， 过 了 七 八 年 依然 什么 消息 都 没有 ， 苏 知 兰 很 想念 老公 ， 但 有 什么 办 
法 呢 ， 便 将 无 限 的 情思 写成 一 首 首 诗 文 ， 并 按 一 定 的 规律 排列 起 来 ， 然 
后 用 五 彩 丝线 绣 在 锦 帕 之 上 。《 政 现 图 》， 总 计 八 百 四 十 一 字 ， 除 正中 
央 之 “ 心 ” 字 为 后 人 所 加 外 ， 原 诗 共 八 百 四 十 字 ， 纵 横 各 二 十 九 字 ， 纵 、 

横 、 斜 、 交 互 、 正 、 反 境 或 退 一 字 、 送 一 字 送 均 可 成 圭 , 等 有三 、 四 、 
OU oe vee 
是 7958 首 。 











例如 从 最 右 侧 直 行 开 始 ， 随 文 势 折返 ， 可 发 现 右 上 角 区 块 外 围 顺 时 针 读 
KA AMEER, WEBRSS, KIRE E ce, ah 
B”, MIREA AENEA Tad MURA BE a Hg G, Src EE ez REE 
WK, SSBAR SH, BRB”. Æ KILE PRUE 
不 胜 枚 举 ， 可 以 称 得 上 是 回 文 诗 中 的 千古 力作 了 ! 



















UE TOL 
PERERA GM TS OE OO 
a em COU Sh a 
RRMA TERR EMBRAER 
TERRANCE EAT OE a T 
ASTA TERSA DD yiti] 
DEE MH 2 OE AMA SB HR 
GHRAC ERIE SS RE oa BS d 
EARLEN) SAIA, KERIEN EH 
HaHa a mA RAL 
SEPA ATE nas rn 
BSAA AMAR 全人代 
li TT TR OE RAR 
UE A TAA FRE ML A 
HAEEREN AON MANENE A 
AARAL RAN ERNEA EAEN A 
PEPA SAN. DA EU CERERI NI 
KERRU HEREN EAI WARS 
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SHAH 1 9 りり Bele hee 


WRAY FA a PANERAI 
RAE — OR SRO EN ae Ra 
UL PPE ara OY Uh C L A EE RR RRR Og 
OER WS EE PR EA 
SRNL -i8 0 E A EAI TTY 
OH ARR MR ON) 8 SE AAA 
FERREE HANH IS LA A 
OMIA he TEENTAAL ENERE ARN 
RURALNA ML KREN EE RELER 


图 5-9-1 
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有 兴趣 的 同学 可 以 搜索 相关 的 文献 ， 了 解 这 张 《瑞丽 图 》 的 神奇 之 处 ， 
不 过 似乎 这 更 像 是 对 文科 学 生 的 要 求 。 我 想 强 调 的 是 ， 所 谓 回 文 ， 就 是 
一 个 字 串 的 逆转 显示 ， 我 们 只 要 在 串 的 抽象 数据 类 型 中 增加 一 种 逆转 


reverse 的 操作 ， 就 可 以 实现 这 样 的 功能 。 


如 果 你 可 以 利用 你 已 有 的 数据 


结构 和 算法 知识 ， 特 别 是 串 的 知识 ， 实 现 对 蔬 丽 图 古诗 的 破解 (将 各 种 
规则 下 对 应 的 诗 输 出 出 来 》， 那 我 相信 ， 你 的 编程 能 力 ， 至 少 在 字符 串 


处 理 的 编程 能 力 已 经 到 了 一 个 非常 高 的 高 度 了 。 


好 了 ， 今 天 的 课 就 到 这 ， 下 课 。 


第 6 草 P 





樹 (Tree) 是 n (nz0) 个 结 点 的 有 限 集 。n=0 时 称 为 空 树 。 在 任意 一 标 
非 空 树 中 : (1) 有 且 仅 有 一 个 特定 的 称 为 根 (Root) 的 结 点 ; (2) 4 
n 之 1 时 ， 其 余 结 点 可 分 为 m (m>0) 全 互 不 相 交 的 有限 集 T,、T。、 

en 、T”， 其 中 每 一 个 集合 本 身 叉 是 一 棵 树 ， 并 且 称 为 根 的 子 树 
(SubTree) 。 


6.1 开场 日 


2010 年 一 部 电影 创造 了 奇迹 ， 它 是 全 球 第 一 部 票房 到 达 27 亿 美元 、 总 票 
房 历 史 排 名 第 一 的 影片 ， 那 就 是 詹姆斯 : 卡 梅 隆 执导 的 电影 《 阿 几 达 》 
(Avatar) 。 





LE 16 DÉCEMBRE: 


WWW AVATAR LEST. COM 





6-1-1 


电影 里 提 到 了 一 棵 高 达 900 英 尺 〈 约 274 米 ) 的 参天 巨 树 ， 是 那个 潘多拉 
星球 的 纳 威 人 的 家 园 ， 让 人 印象 非常 深刻 。 可 惜 那 只 是 导演 的 梦想 ， 地 
球 上 不 存在 这 样 的 物种 。 


无 论 多 高 多 大 的 树 ， 那 也 是 从 小 到 大 、 由 根 到 时 、 一 点 点 成 长 起 来 的 。 
俗话 说 十 年 树木 、 百 年 树 人 ， 可 一 棵 大 树 又 何止 是 十 年 这 样 容易 一 一 哈 
OO 
ピュ Wo 








6.2 树 的 定义 








之 前 我 们 一 直 在 谈 的 是 一 对 一 的 线性 结构 ， 可 现实 中 ， 还 有 很 多 一 对 多 
的 情况 需要 处 理 ， 所 以 我 们 需要 研究 这 种 一 对 多 的 数据 结构 一 一 “ 树 ”， 
考虑 它 的 各 种 特性 ， 来 解决 我 们 在 编程 中 碰 到 的 相关 问题 。 











树 (Tree) 是 n (nz0) 个 结 点 的 有 限 集 。n=0 时 称 为 空 树 。 在 任意 一 棵 
非 空 树 中 : (1) 有 且 仪 有 一 个 特定 的 称 为 根 (Root) 的 结 点 ;，(2) 4 
n 之 1 时 ， 其 余 结 点 可 分 为 m (m>0) 全 互 不 相 交 的 有限 集 T,、T。、 

Se 、T”， 其 中 每 一 个 集合 本 身 又 是 一 棵 树 ， 并 且 称 为 根 的 子 树 
(SubTree) ， 如 图 6-2-1 所 示 。 





图 6-2-1 


树 的 定义 其 实 就 是 我 们 在 讲解 栈 时 提 到 的 递归 的 方法 。 也 就 是 在 树 的 定 
义 之 中 还 用 到 了 树 的 概念 ， 这 是 一 种 比较 新 的 定义 方法 。 图 6-2-2 的 子 树 
Ti 和 子 树 T, 束 是 根 结 点 A 的 子 树 。 当 然 , D、G、H、I 组 成 的 树 又 是 B 为 
根 结 点 的 子 树 ，E、J 组 成 的 树 是 以 C 为 根 结 点 的 子 树 。 





图 6-2-2 


对 于 树 的 定义 还 需要 强调 两 点 : ”1.n>0 时 根 结 点 是 唯一 的 ， 不 可 能 存在 
多 个 根 结 点 ， 别 和 现实 中 的 大 树 混 在 一 起 ， 现 实 中 的 树 有 很 多 根 须 ， 那 
征 真 实 的 树 ， 数 据 结构 中 的 树 是 只 能 有 一 个 根 结 点 。 2.m>0 时 ， 子 树 的 
个 数 没有 限制 ， 但 它们 一 定 是 互 不 相交 的 。 像 图 6-2-3 中 的 两 个 结构 就 不 
符合 树 的 定义 ， 因 为 它们 都 有 相交 的 子 树 。 





树 的 结 点 包含 一 个 数据 元 素 及 若干 指 癌 其 子 树 的 分 文 。 绪 点 拥有 的 子 树 

数 称 为 结 点 的 度 (De-gree〉。 皮 为 0 的 结 点 称 为 叶 结 点 (Leaf) 或 终端 

结 点 ， 虐 不 为 0 的 结 点 称 为 非 终 端 结 点 或 分 支 结 点 。 除 根 结 点 之 外 ， 分 

文 结 点 也 称 为 内 部 结 点 。 树 的 度 是 树 内 各 结 点 的 度 的 最 大 值 。 如 图 6-2-4 

o 因为 这 标 树 结 点 的 度 的 最 大 值 是 结 点 D 的 度 ， 为 3， 所 以 树 的 度 
为 3。 
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图 6-2-4 
6.2.2 ” 结 点 间 关 系 


结 点 的 子 树 的 根 称 为 该 结 点 的 孩子 (Child) ， 相 应 地 ， 该 结 点 称 为 孩 
子 的 双亲 (Parent) 。 咽 ， 为 什么 不 是 父 或 母 ， 叫 双亲 了 呢 ? 呵呵 ， 对 于 
结 点 来 说 其 父母 同体 ， 唯 一 的 一 个 ， 所 以 只 能 把 它 称 为 双 杀 了 。 同 一 个 
双亲 的 孩子 之 间 互 称 兄弟 〈Sibling) 。 结 点 的 祖先 是 从 根 到 该 结 点 所 经 
分 支 上 的 所 有 结 点 。 所 以 对 于 H 来 说 ，D、B、A 都 是 它 的 祖先 。 反 之 ， 
以 某 结 点 为 根 的 子 树 中 的 任 一 结 点 都 称 为 该 结 点 的 子孙 。B 的 子孙 有 
D、G、H、I， 如 图 6-2-5 所 示 。 
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图 6-2-5 


6.2.3 树 的 其 他 相关 概念 


结 点 的 层次 (Level) 从 根 开 始 定义 起 ， 根 为 第 一 层 ， 根 的 孩子 为 第 二 
层 。 知 某 结 点 在 第 ] 层 ， 则 其 子 树 就 在 第 I+1 层 。 其 双 末 在 同一 层 的 结 点 
互 为 党 兄弟 。 显 然 图 6-2-6 中 的 D、E、F 是 党 兄弟 ， 而 G、H、1I 与 ] 也 是 
尝 见 第。 树 中 结 点 的 最 大 层次 称 为 树 的 深度 (Depth) 或 高 度 ， 当 前 树 
的 深度 为 4。 











图 6-2-6 








如 果 将 树 中 结 点 的 各 子 树 看 成 从 左 至 右 是 有 次 序 的 ， 不 能 互 换 的 ， 则 称 





该 树 为 有 序 树 ， 售 则 称 为 无 序 树 。 


森林 (Forest) fem (m20) 棵 互 不 相交 的 树 的 集合 。 对 树 中 每 个 结 点 而 
言 ， 其 子 树 的 集合 即 为 森林 。 对 于 图 6-2-1 中 的 树 而 言 ， 图 6-2-2 中 的 两 
棵 子 树 其 实 就 可 以 理解 为 森林 。 


对 比 线性 表 与 树 的 结构 ， 它 们 有 很 大 的 不 同 ， 如 图 6-2-7 所 示 。 





i NOR: TAL Hes 无 双亲, Mm 
"最 后 一 个 数据 元 素 ; 无 后 继 =| Mam EET, MG 


中间 元 素 ， 一 个 前 驱 一 个 后 继 “中 间 结 后 一 个 双 末 多 个 孩子 


图 6-2-7 


6.3 树 的 抽象 数据 类 型 


相对 于 线性 结构 ， 树 的 操作 束 完 全 不 同 了 ， 这 里 我 们 给 出 一 些 基本 和 党 
用 操作 。 


ADT 樹 (tree ) 

























































































































































































Data 
树 是 由 一 个 根 结 点 和 若干 棵 子 树 构成 。 树 中 结 点 具有 相同 数据 类 型 及 层次 关系 。 
Operation 
TnitTree( *T) : 构造 空 树 T。 
DestroyTree( *T) : 销毁 树 T。 
CreateTree(*T, definition): 按 definition 中 给 出 树 的 定义 来 构造 树 。 
ClearTree(*T): 若 树 T 存 在 ， 则 将 树 T 清 为 空 树 。 
TreeEmpty(T): 若 T 为 空 树 ， 返 回 true， 和 否则 返回 false。 
TreeDepth(T): 返回 T 的 深度 。 
Root(T) : 返回 T 的 根 结 点 。 
Value(T, cur_e): cur_e 是 树 T 中 一 个 结 点 ， 返 回 此 结 点 的 值 。 
Assign(T, cur_e, value): 给 树 T 的 结 点 cur_e 赋 值 为 Value。 
Parent(T, cur_e): 若 cur_e 是 树 T 的 非 根 结 点 ， 则 返回 它 的 双亲 ， 和 否则 返回 空 。 
LeftChi1d(T, cur_e): 若 cur_e 是 树 T 的 非 叶 结 点 ， 则 返回 它 的 最 左 孩 子 ， 否 则 返回 空 。 
RightSib1ing(T, cur_e): 若 cur_e 有 右 兄弟 ， 则 返回 它 的 右 兄弟 ， 否 则 返回 空 。 
InsertChild(*T, *p, i, c): ”其 中 p 指 向 树 T 的 某 个 结 点 ，i 为 所 指 结 点 p 的 度 加 上 1， 
非 空 树 c 与 T 不 相交 ， 操 作 结 果 为 插入 c 为 树 T 中 p 指 结 点 的 第 i 棵 子 








树 。 














DeleteChild(*T, *p, i): 其 中 p 指 向 树 T 的 某 个 结 点 ，i 为 所 指 结 点 p 的 度 ， 
操作 结果 为 删除 T 中 p 所 指 结 点 的 第 i 棵 子 树 。 











endADT 


6.4 树 的 存储 结构 


TR 


先 来 看 看 顺序 存储 结构 ， 用 一 段 地 址 连续 的 存储 单元 依次 存储 线性 表 的 
数据 元 素 。 这 对 于 线性 表 来 说 是 很 自然 的 ， 对 于 树 这 样 一 多 对 的 结构 
呢 ? 











树 中 茶 个 结 点 的 孩子 可 以 有 多 个 ， 这 就 意味 着 ， 无 论 按 何 种 顺序 将 树 中 
所 有 结 点 存储 到 数组 中 ， 结 点 的 存储 位 置 都 无 法 直接 反映 逻辑 关系 ， 你 
想 想 看 ， 数 据 元 素 挨个 的 存储 ， 谁 是 谁 的 双 杀 ， 谁 是 谁 的 孩子 呢 ? 简单 
的 顺序 存储 结构 是 不 能 满足 树 的 实现 要 求 的 。 


不 过 充分 利用 顺序 存储 和 链 式 存储 结构 的 特点 ， 完 全 可 以 实现 对 树 的 存 
储 结构 的 表示 。 我 们 这 里 要 介绍 三 种 不 同 的 表示 法 : 双亲 表示 法 、 孩 子 
表示 法 、 孩 子 兄弟 表示 法 。 


6.4.1 ”双亲 表示 法 











我 们 人 可 能 因为 种 种 原因 ， 没 有 孩子 ， 但 无 论 是 谁 都 不 可 能 是 从 石头 里 
中 出 来 的 ， 孙 悟空 显然 不 能 算是 人 ， 所 以 是 人 一 定 会 有 父母 。 树 这 种 结 
构 也 不 例外 ， 除 了 根 结 点 外 ， 其 余 每 个 结 点 ， 它 不 一 定 有 孩子 ， 但 古 一 
定 有 且 仅 有 一 个 双 杀 。 





我 们 假设 以 一 组 连续 空间 存储 树 的 结 皮 ， 同 时 在 每 个 结 点 中 ， 附 设 一 个 
指示 器 指示 其 双亲 结 点 在 数组 中 的 位 置 。 也 就 是 说 ， 每 个 结 点 除了 知道 
目 己 是 谁 以 外 ， 还 知道 它 的 双亲 在 哪里 。 它 的 结 点 结构 为 表 6-4-1 所 示 。 








表 6-4-1 


data parent 





其 中 data 是 数据 域 ， 和 存储 结 点 的 数据 信息 。 而 parent 是 指针 域 ， 存 储 该 结 
点 的 双 杀 在 数组 中 的 下 标 。 


以 下 是 我 们 的 双 杀 表示 法 的 结 点 结构 定义 代码 。 


/* 树 的 双亲 表示 法 结 点 结构 定义 */ 
#define MAX_TREE_STZE 100 

/* 树 结 点 的 数据 类 型 ， 目 前 暂 定 为 整 型 */ 
typedef int TElemType; 

/* 结 点 结构 */ 

typedef struct PTNode 











/* 结 点 数据 */ 
TElemType data; 
7* SRM */ 
int parent; 

} PTNode: 

/* 树 结构 */ 

typedef struct 





/* Se */ 


PTNode nodes[MAX_TREE_STZE] / 
/* 根 的 位置 和希 点数 */ 
ae ie, E 

} PTree; 











有 了 这 样 的 结构 定义 ， 我 们 就 可 以 来 实现 双 杀 表示 法 了 。 由 于 根 结 点 是 
没有 双亲 的 ， 所 以 我 们 约定 根 结 点 的 位 置 域 设置 为 -1， 这 也 就 意味 着 ， 
我 们 所 有 的 结 点 都 存 有 它 双亲 的 位 置 。 如 图 6-4-1 中 的 树 结构 和 表 6-4-2 
中 的 树 双 杀 表示 所 示 。 











图 6-4-1 


表 6-4-2 


下 标 data parent 


0 A -1 
1 B 0 
2 C 0 
3 D 1 
4 lg 2 
5 上 2 
6 © fS 
7 H 3 
8 I 3 
9 J 4 


这 样 的 存储 结构 ， 我 们 可 以 根据 结 点 的 parent 指 针 很 容易 找到 它 的 双亲 
结 点 ， 所 用 的 时 间 复 杂 度 为 0(1)， 直 到 parent 为 -1 时 ， 表 示 找 到 了 树 结 

AYO RATE AE aE IN Feta, 対 不 起 , aE Soh 
AAT 


AER, HER AECRE— FE? 


当然 可 以 。 我 们 增加 一 个 结 点 最 左边 孩子 的 域 ， 不 妨 叫 它 长 子 域 ， 这 样 
就 可 以 很 容易 得 到 结 点 的 孩子 。 如 果 没 有 和 孩子 的 结 点 ， 这 个 长 子 域 就 设 
置 为 -1， 如 表 6-4-3 所 示 。 











表 6-4-3 





对 于 有 0 个 或 1 个 孩子 结 点 来 说 ， 这 样 的 红 KMENA T ERA 点 孩子 的 问 
题 了 。 甚 至 是 有 2 个 孩子 ， 知 道 了 长 子 是 谁 ， 另 一 个 当然 就 是 次 子 了 





另外 一 个 问题 场景 ， 我 们 很 关注 各 兄弟 之 间 的 关系 ， 双 杀 表 示 法 无 法 体 
现 这 样 的 关系 ， 那 我 们 怎么 办 ? W, 可以 増加 一 條 右 兄 第 域 来 体現 兄弟 
RA, Hee, B-MAMMRE EEA UA, Wits RAAF 








标 。 同 样 的 ， 如 果 右 兄弟 不 存在 ， 则 赋值 为 -1， 如 表 6-4-4 所 示 。 


FE 





表 6-4-4 








但 如 果 结 点 的 孩子 很 多 ， 超 过 了 2 个 。 我 们 又 关注 结 点 的 双亲 、 又 关注 
结 点 的 孩子 、 还 关注 结 点 的 兄弟 ， 而 且 对 时 间 人 遍历 要 求 还 比较 高 ， 那 么 
我 们 还 可 以 把 此 结构 扩展 为 有 双亲 域 、 长 子 域 、 再 有 右 兄弟 域 。 存 储 结 
构 的 设计 是 一 个 非常 灵活 的 过 程 。 一 个 存储 结构 设计 得 是 否 合理 ， 取决 














于 基于 该 存储 结构 的 运算 是 否 适 合 、 是 人 否 方 便 ， 时 间 复 杂 度 好 不 好 等 。 
注意 也 不 是 越 多 越 好 ， 有 需要 时 再 设计 相应 的 结构 。 束 像 再 好 听 的 疼 

乐 ， 不 俘 反 复 听 上 千 所 也 会 展 味 ， 再 好 看 的 电影 ， 一 段 时 间 反 复 看 上 百 
过， 也 会 无 趣 ， 你 们 说 是 吧 ? 





6.4.2 ”孩子 表示 法 


换 一 种 完全 不 同 的 考虑 方法 。 由 于 树 中 每 个 结 点 可 能 有 多 柠 子 树 ， 可 以 
考 谍 用 多 重 链表 ， 即 每 个 结 点 有 多 个 指针 域 ， 其 中 每 个 指针 指 癌 一 株 子 
树 的 根 结 点 ， 我 们 把 这 种 方法 叫做 多 重 链表 表示 法 。 不 过 ， 树 的 每 个 结 
ee 也 就 是 它 的 孩子 个 数 是 不 同 的 。 所 以 可 以 设计 两 种 方案 来 解 
TR o 





方 案 一 





一 种 是 指针 域 的 个 数 就 等 于 树 的 度 ， 复 习 一 下 ， 树 的 度 是 树 各 个 结 点 度 
的 最 大 值 。 其 结构 如 表 6-4-5 所 示 。 


aa [ain [ii [em | 


表 6-4-5 





其 中 data 是 数据 域 。child1 到 childd 是 指针 域 ， 用 来 指向 该 结 点 的 孩子 结 
=e 


对 于 图 6-4-1 的 树 来 说 ， 树 的 度 是 3， 所 以 我 们 的 指针 域 的 个 数 是 3， 这 种 
方法 实现 如 图 6-4-2 所 示 。 


DARD Cp 
el eae 
Bono 


图 6-4-2 








这 种 方法 对 于 树 中 各 结 点 的 度 相 差 很 大 时 ， 显 然 是 很 浪费 空间 的 ， 因 为 
有 很 多 的 结 点 ， 它 的 指针 域 都 是 空 的 。 不 过 如 果树 的 各 结 点 度 相差 很 小 
a een rane Nee eel 














既然 很 多 指针 域 都 可 能 为 空 ， 为 什么 不 按 需 分 配 空间 呢 。 于 是 我 们 有 了 
第 二 种 方案 。 


方案 二 


第 二 种 方案 每 个 结 点 指针 域 的 个 数 等 于 该 结 氮 的 度 ， 我 们 专门 取 一 个 位 
置 来 存储 结 点 指针 域 的 个 数 ， 其 结构 如 表 6-4-6 所 示 。 


lie [oh i e a 


表 6-4-6 





其 中 data 为 数据 域 ，degree 为 度 域 ， 也 就 是 存储 该 结 点 的 孩子 结 点 的 个 
数 ，child1 到 childd 为 指针 域 ， 指 癌 该 结 点 的 各 个 孩子 的 结 点 。 





对 于 图 6-4-2 的 树 来 说 ， 这 种 方法 实现 如 图 6-4-3 所 示 。 
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图 6-4-3 








这 种 方法 克服 了 浪费 空间 的 缺点 ， 对 空间 利用 率 是 很 品 了 ， 但 是 由 于 各 


个 结 点 的 链表 是 不 相同 的 结构 ， 加 上 要 维护 结 点 的 度 的 数值 ， 在 运算 上 
就 会 带 来 时 间 上 的 损耗 。 


能 否 有 更 好 的 方法 ， 既 可 以 减少 空 指针 的 浪费 叉 能 使 结 点 结构 相同 。 


仔细 观察 ， 我 们 为 了 要 避 历 整 标 树 ， 把 每 个 结 点 放 到 一 个 顺序 存储 结构 
的 数组 中 是 合理 的 ， 但 每 个 结 点 的 孩子 有 多 少 是 不 确定 的 ， 所 以 我 们 再 
对 每 个 结 点 的 孩子 建立 一 个 单 链 表 体 现 它们 的 关系 。 





这 就 是 我 们 要 讲 的 孩子 表示 法 。 具 体 办 法 是 ， 把 每 个 结 点 的 孩子 结 反 排 
列 起 来 ， 以 单 链表 作 存 储 结构 ， 则 n 个 结 点 有 n 个 孩子 链表 ， 如 果 是 叶子 
结 点 则 此 单 链表 为 空 。 然 后 n 个 头 指 针 又 组 成 一 个 线性 表 ， 采 用 顺序 存 
储 结构 ， 存 放 进 一 个 一 维 数组 中 ， 如 图 6-4-4 所 示 。 
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图 6-4-4 


-个 是 孩子 链表 的 孩子 结 皮 ， 如 表 6-4-7 所 





为 此 ， 设 计 两 种 结 点 结构 ， 
ZN 。 


表 6-4-7 


child next 


其 中 child 是 数据 域 ， 用 来 存储 条 个 结 点 在 表 头 数组 中 的 下 标 。next 是 指 
针 域 ， 用 来 存储 指 癌 某 结 点 的 下 一 个 孩子 结 点 的 指针 。 





Fy NER AN EK a A 如 表 6-4-8 所 示 。 


表 6-4-8 


data firstchild 





其 中 data 起 数 据 域 , 存 修 茶 策 点 的 数 据 信忠 。firstchild 赴 共 指 針 域 存 
储 该 结 反 的 孩子 链表 的 头 指针 。 


以 下 是 我 们 的 孩子 表示 法 的 结构 定义 代码 。 


/* 树 的 孩子 表示 法 结构 定义 */ 
#define MAX_TREE_SIZE 100 


/* BAR */ 
typedef struct CTNode 


antec ha 
struct CTNode *next; 
} *ChildPtr; 
/* 表 头 结构 */ 
typedef struct 
{ 


TElemType data; 
ChildPtr firstchild; 
} CTBox; 
/* 树 结构 */ 
typedef struct 


/* 结 点 数组 */ 
CTBox nodes[MAX_TREE_SIZE]; 
/* 根 的 位 置 和 结 点 数 */ 
a ATA 
} CTree; 
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但 是 ， 这 也 存在 着 问题 ， 我 如 何 知道 某 个 结 点 的 双亲 是 谁 呢 ?” 比 较 麻 
烦 ， 需 要 整 棵 树 亿 历 才 行 ， 难 道 就 不 可 以 把 双亲 表示 法 和 孩子 表示 法 综 
合 一 下 吗 ? 当然 是 可 以 。 如 图 6-4-5 所 示 。 


下 标 data patent firstchild child next 
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图 6-4-5 











我 们 把 这 种 方法 称 为 双 杀 孩子 表示 法 ， 应 该 算是 孩子 表示 法 的 改进 。 至 
于 这 个 表示 法 的 具体 结构 定义 ， 这 里 就 略 过 ， 留 给 同学 们 目 己 去 设计 
Ts 





6.4.3 ”孩子 兄弟 表示 法 


刚才 我 们 分 别 从 双色 的 角度 和 从 孩子 的 角度 研究 树 的 存储 结构 ， 如 采 我 
们 从 树 结 点 的 兄弟 的 角度 考虑 又 会 如 何 呢 ? 当然 ， 对 于 树 这 样 的 层级 结 
构 来 说， 只 研究 结 点 的 兄弟 是 不 行 的 ， 我 们 观察 后 发 现 ， 任 意 一 柠 树 ， 
它 的 结 点 的 第 一 个 孩子 如 果 存 在 束 是 唯一 的 ， 它 的 右 兄 第 如 果 存 在 也 是 
唯一 的 。 因 此 ， 我 们 设置 两 个 指针 ， 分 别 指向 该 结 点 的 第 一 个 孩子 和 此 
结 点 的 右 兄 第 。 





结 点 结构 如 表 6-4-9 所 示 。 


表 6-4-9 


data firstchild rightsib 





其 中 data 是 数据 域 ，firstchild 为 指针 域 ， 存 储 该 结 反 的 第 一 个 孩子 结 点 
的 存储 地 址 ，right-sib 是 指针 域 ， 存 储 该 结 点 的 右 兄 第 结 扩 的 存储 地 
址 。 





结构 定义 代码 如 下 。 





/* 树 的 孩子 兄弟 表示 法 结构 定义 */ 
typedef struct CSNode 


TElemType data: 
struct CSNode *firstchild, 
*rightsib; 
} CSNode, *CSTree; 








对 于 图 6-4-1 的 树 来 说 ， 这 种 方法 实现 的 示意 图 如 图 6-4-6 所 示 。 
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图 6-4-6 





这 种 表示 法 ， 给 碍 找 茶 个 结 点 的 某 个 孩子 带 来 了 方便 ， 只 需要 通过 





fistchild 找 到 此 结 点 的 长 子 ， 然 后 再 通过 长 子 结 扣 的 rightsib 找 到 它 的 二 
第 ， 接 着 一 直下 去 ， 直 到 找到 具体 的 孩子 。 当 然 ， 如 果 想 找 东 个 络 氮 的 
双 杀 ， 这 个 表示 法 也 是 有 缺陷 的 ， 那 怎么 办 呢 ? 





呵呵 ， 对 ， 如 果真 的 有 必要 ， 完 全 可 以 再 增加 一 个 parent 指 针 域 来 解决 
快速 僵 找 双亲 的 问题 ， 这 里 整 不 再 细 谈 了 。 








其 实 这 个 表示 法 的 最 大 好 处 是 它 把 一 棵 复杂 的 树 变 成 了 一 棵 二 又 树 。 我 
们 把 图 6-4-6 变 变形 就 成 了 图 6-4-7 这 个 样子 。 


No 
K 


ss 

aj ja 

レト 

Py IA} lelli 
ey) [時 本 
BD 


图 6-4-7 


这 样 就 可 以 充分 利用 二 又 树 的 特性 和 算法 来 处 理 这 棵 树 了 。 咽 ? 有人 
问 ， 二 叉 树 是 什么 ? 哈哈 ， 别 急 ， 这 正 是 我 接 下 来 要 重点 讲 的 内 容 。 











6.5 — SOT AYE 


现在 我 们 来 做 个 游戏 ， 我 在 纸 上 已 经 写 好 了 一 个 100 以 内 的 正 整数 数 
A a 
， 我 的 回答 只 会 告诉 你 是 “大 了 ”或 “小 了 ”。 





这 个 游戏 在 一 些 电 视 节 目 中 ， 猜 测 一 些 商 品 的 定价 时 常会 使 用 。 我 看 到 
过 有 些 人 是 一 点 一 点 的 数字 累加 的 ， 比 如 5、10、15、20 这 样 猜 ， 这 样 
NN 显然 是 没有 学 过 数据 结构 和 算法 的 人 才 做 得 出 的 











其 实 这 是 一 个 很 经 典 的 折 半 和 碍 找 算 法 。 如 采 我 们 用 图 6-5-1〈 下 三 层 省 
He) 的 办 法 ， 就 一 定 能 在 7 次 以 内 ， 猜 出 结果 来 。 
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由 于 是 100 以 内 的 正 整数 ， 所 以 我 们 先 猜 50 (100 的 一 半 ) ， 被 告 之 “大 
了 ”， 于 是 再 猜 25 (50 的 一 半 ) ， 被 告 之 “小 了 ”， 再 猜 37〈25 与 50 的 中 
WAO ANS, Fe, 大 了 , 40, KT, 38, 小 了 , 39, 完全 正 
确 。 过 程 如 表 6-5-1 所 示 。 


MES 
39 0 5 |37 |43 |40 jas ja | 





表 6-5-1 


我 们 发 现 ， 如 宁 用 这 种 方式 进行 查找， 效率 高 


图 6-5-2 


6.5.1 二叉树 特点 


王丸 樹 的 特 点 有 : 





。 每 个 结 点 最 多 有 两 株 子 树 ， 所 以 二 又 树 中 不 存在 度 大 于 2 的 结 点 。 
A i A TT 
是 可 以 的 。 

。 左 子 树 和 右 子 树 是 有 顺序 的 ， 次 序 不 能 任意 颠倒 。 束 像 人 有 双手 、 
双 脚 ， 但 显然 左手 、 左 脚 和 右手 、 右 脚 是 不 一 样 的 ， 右 手 戴 左 手 
E. AT A ERRES o 

。 BIE HR AARP, BERK eee Pde TM 
圏 6-5-3 中 , IAI ERRAN, (BEA TAIN — OY. ee 
像 你 一 不 小 心 ， 控 伤 了 手 ， 伤 的 是 左手 还 是 右手 ， 对 你 的 生活 影响 
度 是 完全 不 同 的 。 




















間 W2 


图 6-5-3 





二 义 树 具有 五 种 基本 形态 : LOM. 2. 只 有 一 个 根 结 点 。 3. 根 结 点 
只 有 左 子 树 。 4. 根 结 点 只 有 右 子 树 。 5. 根 结 点 既 有 左 子 树 又 有 右 子 树 。 


应 该 说 这 五 种 形态 还 是 比较 好 理解 的 ， 那 我 现在 问 大 家 ， 如 果 是 有 三 个 
OO 
几 种 形态 ? 


耕 只 从 形态 上 考虑 ， 三 个 结 点 的 树 只 有 两 种 情况 ， 那 就 是 图 6-5-4 中 有 两 
层 的 树 1 和 有 三 层 的 后 四 种 的 任意 一 种 ， 但 对 于 二 又 树 来 说 ， 由 于 要 区 
ZXW. 


树 | A? 树 3 树 树 5 


图 6-5-4 
6.5.2 特殊 二 叉 樹 


我 们 再 来 介绍 一 些 特殊 的 二 又 树 。 这 些 树 可 能 暂时 你 不 能 理解 它 有 什么 
用 处 ， 但 先 了 解 一 下 ， 以 后 会 提 到 它们 的 实际 用 途 。 


1. RH 


顾名思义 ， 和 斜 树 一 定 要 是 斜 的 ， 但 是 往 哪 糙 还 是 有 讲 完 。 所 有 的 结 氮 都 

只 有 左 子 树 的 二 叉 树 叫 左 斜 树 。 所 有 结 点 都 是 只 有 右 子 树 的 二 叉 树 叫 右 
abit 1X PA RAR AR» B6-5-4F AIR Qi ce Ac RT, 樹 5 就 着 右 斜 
树 。 斜 树 有 很 明显 的 特点 ， 就 是 每 一 层 都 只 有 一 个 结 点 ， 结 扩 的 个 数 与 
王丸 樹 的 深度 相同 。 





有 人 会 想 ， 能 叫 树 呀 ， 与 我 们 的 线性 表 结 构 不 是 一 样 吗 。 对 的 ， 
KARTER? TERRA 种 极其 特殊 的 表现 形式 。 


2. 满 二 又 树 





苏东坡 曾 有 词 云 :“ 人 有 赤 欢 离合 ， 月 有 阴 晴 圆 缺 ， 此 事主 难 全 ?”。 意 思 
就 是 完美 是 理想 ， 不 完美 才 是 人 生 。 我 们 通常 举 的 例子 也 都 是 左 高 右 
低 、 参 差 不 齐 的 二 又 树 。 那 是 否 存在 完美 的 二 又 树 呢 ? 








嗯 ， 有 同学 已 经 在 空中 手指 比划 起 来 。 对 的 ， 完 美的 二 叉 树 是 存在 的 。 





在 一 柠 二 叉 树 中 ， 如 果 所 有 分 支 结 点 都 存在 左 子 树 和 右 子 树 ， 并 且 所 有 
叶子 都 在 同一 层 上 ， 这 样 的 二 又 树 称 为 满 二 又 树 。 





图 6-5-5 就 是 一 柠 满 二 又 树 ， 从 样子 上 看 就 感觉 它 很 完美 。 


图 6-5-5 





单 是 每 个 结 点 都 存在 左右 子 树 ， 不 能 算是 满 二 又 树 ， 还 必须 要 所 有 的 叶 
子 都 在 同一 层 上 ， 这 就 做 到 了 人 整 柠 树 的 平衡 。 因 此 ， 满 二 又 树 的 特 操 
A: (1) 叶子 只 能 出 现在 最 下 一 层 。 出 现在 其 他 层 就 不 可 能 达成 平 
衡 。 (2) 非 叶子 结 点 的 度 一 定 是 2。 否 则 就 是 “ 缺 胜 膊 少 腿 *” 了 。 (3) 
在 同样 深度 的 二 叉 树 中 ， 满 二 又 树 的 结 点 个 数 最 多 ， 叶 子 数 最 多 。 











3. 完全 二 叉 樹 


RA Ao ai A OR oS) URS AL (1zizn) WAER 
TPT EY ti — SOS SS AEN 2a ESO ETA, 別 
PR — PR AEE — OY, 如 図 6-5-6 所 示 。 


图 6-5-6 
这 是 一 种 有 些 理解 难度 的 特殊 二 又 树 。 


首先 从 字面 上 要 区 分 , “SER AIR IN ETE 満 二 叉 樹 一 定 走 一 棟 完 全 
二 又 树 ， 但 完全 二 又 树 不 一 定 是 满 的 。 








其 次 ， 完 全 二 又 树 的 所 有 结 点 与 同样 深度 的 满 二 又 树 ， 它 们 按 层 序 编号 
相同 的 结 皮 ， 是 一 一 对 应 的 。 这 里 有 个 关键 词 是 按 层 序 编号 ， 像 图 6-5-7 
中 的 树 1， 因 为 5 结 皮 没有 左 子 树 ， 却 有 右 子 树 ， 那 就 使 得 按 层 序 编号 的 
第 10 个 编号 空 档 了 。 同 样 道理 ， 图 6-5-7 中 的 树 2， 由 于 3 结 点 没有 子 树 ， 
所 以 使 得 6、7 编 号 的 位 置 空 档 了 。 图 6-5-7 中 的 树 3 又 是 因为 5 编写 下 没有 
子 树 造 成 第 10 和 第 11 位 置 空 档 。 只 有 图 6-5-6 中 的 树 ， 尽 管 它 不 是 满 二 又 
树 ， 但 是 编号 是 连续 的 ， 所 以 它 是 完全 二 又 树 。 


























图 6-5-7 


从 这 里 我 也 可 以 得 出 一 些 完全 二 文 树 的 特点 : (1) 叶子 结 反 只 能 出 现 


fem PRR. (2) 最 下 层 的 叶子 一 定 集 中 在 左 部 连续 位 置 。 (3) 倒数 
二 层 ， 行 有 叶子 结 点 ， 一 定 都 在 右 部 连续 位 置 。 (4) 如 采 结 点 度 为 1， 
则 该 结 点 只 有 左 孩子 ， 即 不 存在 只 有 右 子 树 的 情况 。 (5) 同样 结 反 数 
的 二 又 树 ， 完 全 二 又 树 的 深度 最 小 。 

















从 上 面 的 例子 ， 也 给 了 我 们 一 个 判断 茶 二 又 树 是 否 是 完全 二 又 树 的 办 
法 ， 那 就 是 看 着 树 的 示意 图 ， 心 中 默默 给 每 个 结 点 按照 满 二 又 树 的 结构 
BMP aS, URS LARS, HAN eee SO, A 


FE 


6.6 ”二 又 树 的 性 质 


二 又 树 有 一 些 需要 理解 并 记 住 的 特性 ， 以 便于 我 们 更 好 地 使 用 它 。 


6.6.1 二 又 树 性 质 1 


性 质 1: 在 二 又 树 的 第 i 层 上 至 多 有 2 个 结 点 G21) 。 


这 个 性 质 很 好 记忆 ， 观 察 一 下 图 6-5-5。 





第 一 层 是 根 结 点 ， 只 有 一 个 ， 所 以 2Y1=20=1。 


第 二 层 有 两 个 ，22-1=21=2。 


第 三 层 有 四 个 ，23-1=2“=4。 


第 四 屋 有 八 休 , 2g 


通过 数据 归纳 法 的 论证 ， 可 以 很 容易 得 出 在 二 又 树 的 第 i 层 上 至 多 有 2 





HINA (i>1) 的 结论 。 


6.6.2 ”二 又 树 性 质 2 


性 质 2: 深度 为 k 的 二 又 树 至 多 有 2*-1 个 结 点 (kz1) 。 


注意 这 里 一 定 要 看 清楚 ， 是 2k 后 再 减 去 1， 而 不 是 251。 以 前 很 多 同学 不 
能 完全 理解 ， 这 样 去 记忆 ， 就 容易 把 性 质 2 与 性 质 1 给 弄 混淆 了 。 











深度 为 k 意 思 就 是 有 k 层 的 二 又 树 ， 我 们 先 来 看 看 简单 的 。 





如 果 有 一 层 ， 至 多 1=21-1 个 结 点 。 


如 果 有 二 层 ， 至 多 1+2=3=22-1 个 结 点 。 








如 果 有 三 层 ， 至 多 1+2+4=7=23-1 个 结 点 。 


如 果 有 四 层 ， 至 多 1+2+4+8=15=24-1 个 结 点 。 





ee 可 以 得 出 ， 如 果 有 k 层 ， 此 二 又 树 至 多 有 2*-1 


6.6.3 ”二 又 树 性 质 3 


性 质 3: 对 任何 一 柠 二 又 树 T， 如 果 其 终端 结 点 数 为 no， 度 为 2 的 结 点 数 
为 ny>， 则 no=n2z+1。 


终 痪 结 点 数 其 实 就 是 叶子 结 点 数 ， 而 一 柠 二 又 树 ， BRT FE RA, F 
PN mie ALON eS, RITE NEELA MATA 


总 数 n=no+ni+no。 








比如 图 6-6-1 的 例子 ， 结 点 总 数 为 10， 它 是 由 A、B、C、D 等 度 为 2 结 
点 ，F、G、 百 、I、J 等 度 为 0 的 叶子 结 点 和 E 这 个 度 为 1 的 结 点 组 成 。 总 
A 10。 





图 6-6-1 


我 们 换个 角度 ， 再 数 一 数 它 的 连接 线 数 ， 由 于 根 结 点 只 有 分 文 出 去 ， 没 
有 分 文 进 入 ， 所 以 分 文 线 总 数 为 结 点 总 数 减 去 1。 图 6-6-1 就 是 9 个 分 文 。 
对 于 A、B、C、D 结 点 来 说 ， 它 们 都 有 两 个 分 文 线 出 去 ， 而 E 结 点 只 有 
一 个 分 支线 出 去 。 所 以 总 分 支线 为 4x2+1x1=9。 





用 代数 表达 就 是 分 文 线 总 数 =n-1=n1 十 2n?。 因 为 刚才 我 们 有 等 式 n=no 十 
n Fn», 所 以 可 推导 出 no 十 ni 十 ny-1=nj 十 2n>。 A WME ngt Le 


6.6.4 二 又 树 性 质 4 


性 质 4: 具有 n 介 和希 点 的 完全 二 叉 樹 的 深度 訪 Ilogsn+1| (Jx| 表 示 不 大 于 x 的 
最大 整数 ) 。 


由 满 二 又 树 的 定义 我 们 可 以 知道 ， 深 度 为 k 的 满 二 又 树 的 结 点 数 n 一 定 是 
2k-1。 因 为 这 是 最 多 的 结 点 个 数 。 那 么 对 于 n=2k-1 倒 推 得 到 满 二 叉 树 的 
深度 为 k=log(n 十 1)， 比 如 结 点 数 为 15 的 满 二 叉 树 ， 深 上 度 为 4。 





完全 二 又 树 我 们 前 面 已 经 提 到 ， 它 是 一 棵 具有 n 个 结 点 的 二 又 树 ， 知 近 
层 序 编号 后 其 编号 与 同样 深度 的 满 二 又 树 中 编号 结 点 在 二 又 树 中 位 置 完 
全 相同 ， 那 它 就 是 完全 二 又 树 。 也 惑 是 说 ， 它 的 叶子 结 点 只 会 出 现在 最 
下 面 的 两 层 。 

















它 的 结 点 数 一 定 少 于 等 于 同样 深度 的 满 二 又 树 的 结 点 数 2*-1， 但 一 定 多 
于 2*-1-1。 即 满足 2*1-1<n<2K-1。 由 于 结 点 数 n 是 整数 ，n<2K-1 意 味 着 
n<2K,n>2F1-1, 意味 着 nz2K-1, 所 以 2FT<n<2k, 不等式 柄 辺 取 対 数 , 得 
到 k-1<logzn<k， 而 k 作 为 深度 也 是 整数 ， 因 此 k=|log2nl+1。 


6.6.5 ”二 又 树 性 质 5 


性 质 5: 如 有 果 对 一 棵 有 n 个 结 点 的 完全 二 又 树 《〈 其 深度 为 ) 的 结 点 按 层 序 
编号 (从 第 1 层 到 第 层 ， 每 层 从 左 到 右 ) ， 对 任 一 结 点 1 (1sisn) 有: 





1. 如 果 i=1， 则 结 点 i 是 二 又 树 的 根 ， 无 双亲 ; 如 果 i>1， 则 其 双亲 是 结 
Fi 


2. 如 果 2i>n， 则 结 点 i 无 左 孩 子 〈( 结 点 i 为 叶子 结 点 〉; 否则 其 左 孩 子 是 
i 





3. 如果 2i+1l>n， 则 结 点 i 死 右 孩 子 ， 人 否则 其 右 孩 子 是 结 点 2i+1。 


我 们 以 图 6-6-2 为 例 ， 来 理解 这 个 性 质 。 这 是 一 个 完全 二 义 树 ， 深 度 为 
4， 结 点 总 数 是 10。 


图 6-6-2 





对 于 第 一 条 来 次 是 很 显然 的 ， 运 1 时 就 是 根 结 点 。 这 1 时 ， 比 如 结 点 7， 生 
的 双 杀 就 是 ， 结 点 9， 它 的 双 杀 就 是 。 





第 二 条 ， 比 如 结 皮 6， 因 为 2x6=12 超 过 了 结 点 总 数 10， 所 以 结 点 6 无 左 孩 
子 ， 它 是 叶子 结 点 。 同 样 ， 而 结 皮 5， 因 为 2x5=10 正 好 是 结 点 总 数 10， 
所 以 它 的 左 孩子 是 结 皮 10。 








第 三 条 ， 比 如 结 点 5， 因 为 2x5+1=11， 大 于 结 点 总 数 10， 所 以 它 无 右 孩 
子 。 而 结 点 3， 因 为 2x3+1=7 小 于 10， 上 所 以 它 的 右 孩 子 是 结 点 7。 





6.7 二叉树 的 存储 结构 
6.7.1 ”二叉树 顺序 存储 结构 





前 面 我 们 已 经 谈 到 了 树 的 存储 结构 ， 并 且 谈 到 顺序 存储 对 树 这 种 一 对 多 
的 关系 结构 实现 起 来 是 比较 困难 的 。 但 是 二 又 树 是 一 种 特殊 的 树 ， 由 于 
它 的 特殊 性 ， 使 得 用 顺序 存储 结构 也 可 以 实现 。 





二 义 树 的 顺序 存储 结构 束 是 用 一 维 数 组 存储 二 又 树 中 的 结 点 ， 并 且 结 反 
的 存储 位 置 ， 也 就 是 数组 的 下 标 要 能 体现 结 点 之 间 的 逻辑 关系 ， 比 如 双 
杀 与 孩子 的 关系 ， 左 右 兄弟 的 关系 等 。 








先 来 看 看 完全 二 又 树 的 顺序 存储 ， 一 棵 完全 二 又 树 如 图 6-7-1 所 示 。 
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图 6-7-1 





将 这 株 二 又 树 存 入 到 数组 中 ， 相 应 的 下 标 对 应 其 同样 的 位 置 ， 如 图 6-7-2 
ZN 
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图 6-7-2 

















这 下 看 出 完全 二 又 树 的 优越 性 来 了 吧 。 由 于 它 定 义 的 严格 ， 所 以 用 顺序 
结构 也 可 以 表现 出 二 又 树 的 结构 来 。 


当然 对 于 一 般 的 二 叉 树 ， 尽 管 层 序 编号 不 能 反映 逻辑 关系 ， 但 是 可 以 将 
其 按 完全 二 又 树 编 号 ， 只 不 过 ， 把 不 存在 的 结 点 设置 为 “人 "而 已 。 如 图 
6-7-3， 注 意 浅 色 结 点 表示 不 存在 。 








图 6-7-3 


考虑 一 种 极端 的 情况 ， 一 棵 深度 为 k 的 右 斜 树 ， 它 只 有 k 个 结 点 ， 却 需要 
分 2 





k-1 个 存储 单元 空间 ， 这 显然 是 对 存储 空间 的 浪费 ， 例 如 图 6-7-4 所 示 。 
所 以 ， 顺 序 存 储 络 构 一 般 只 用 于 完全 二 又 树 。 
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图 6-7-4 


6.7.2 ”二 又 链表 


BRA IU FF fit ED, RANEE SEENTE. OBES 
点 最 多 有 两 个 孩子 ， 所 以 为 它 设 计 一 个 数据 域 和 两 个 指针 域 是 比较 目 然 
的 想法 ， 我 们 称 这 样 的 链表 叫做 二 文 链表 。 结 扣 结 构图 如 表 6-7-1 所 示 。 


表 6-7-1 


lchild data rchild 





其 中 data 是 数据 域 ，lchild 和 rchild 都 是 指针 域 ， 分 别 存放 指向 左 孩 子 和 
右 孩 子 的 指针 。 


以 下 是 我 们 的 二 又 链表 的 结 扣 结构 定义 代码 。 


/* 二 义 树 的 三 叉 链 表 结 点 结构 定义 */ 
/* 结 点 结构 */ 
typedef struct BiTNode 


/* 结 点 数据 */ 

TElemType data; 

/* 左右 璃子 指針 */ 

struct BiTNode *1ch11d, *rchild; 
} BiTNode, *BiTree; 


结构 示意 图 如 图 6-7-5 所 示 。 


MD 


图 6-7-5 





就 如 同 树 的 存储 结构 中 讨论 的 一 样 ， 如 果 有 需要 ， 还 可 以 再 增加 一 个 指 
加 其 双 杀 的 指针 域 ， 那 样 就 称 之 为 三 又 链表 。 由 于 与 树 的 存储 结构 类 
似 ， 这 里 就 不 详 述 了 。 


6.8 ”遍历 二 又 树 
6.8.1 二 义 树 遍历 原理 


假设 ， 我 手头 有 20 张 100 元 的 和 2000 张 1 元 的 奖券 ， 同 时 酒 向 了 空中 ， 大 
家 比赛 看 谁 最 终 捡 的 最 多 。 如 果 是 你 ， 你 会 怎么 做 ? 








相信 所 有 同学 都 会 说 ， 一 定 先 捡 100 元 的 。 道 理 非常 简单 ， 因 为 捡 一 张 
100 元 等 于 1 元 的 拉 100 张 ， 效 率 好 得 不 是 一 点 点 。 所 以 可 以 得 到 这 样 的 
结论 ， 同 样 是 捡 奖券 ， 在 有 限时 间 内 ， 要 达到 最 高 效率 ， 次 序 非 党 重 
要 。 对 于 二 又 树 的 过 历来 讲 ， 次 序 同样 显得 很 重要 。 

















ZXW (traversing binary tree) 是 指 从 根 结 点 出 发 ， 按 照 某 种 次 
序 依次 访问 二 又 树 中 所 有 结 点 ， 使 得 每 个 结 点 被 访问 一 次 且 仅 被 访问 一 
次 。 


这 里 有 两 个 关键 词 : 访问 和 次 序 。 











访问 其 实 是 要 根据 实际 的 需要 来 确定 具体 做 什么 ， 比 如 对 每 个 结 反 进行 
相关 计算 ， 输 出 打印 等 ， 它 算 作 是 一 个 抽象 操作 。 在 这 里 我 们 可 以 简单 
地 假定 访问 就 是 输出 结 点 的 数据 信息 。 








二 又 树 的 遇 历 次 序 不 同 于 线性 结构 ， 节 多 也 就 是 从 头 至 尾 、 循 环 、 双 加 
等 简单 的 衣 历 方式 。 树 的 结 点 之 间 不 存在 唯一 的 前 驱 和 后 继 关 系 ， 在 访 
问 一 个 结 点 后 ， 下 一 个 被 访问 的 结 点 面临 着 不 同 的 选择 。 就 像 你 人 生 的 
道路 上 ， 局 考 填 志愿 要 面临 哪个 城市 、 哪 所 大 学 、 具 体 专 业 等 选择 ， 由 
于 选择 方式 的 不 同 ， 壳 历 的 次 序 束 完全 不 同 了 。 


6.8.2 — pha AIK 


SUS ATT CAT IR, UR T BR Ac BA I OT, 那 
么 主要 就 分 为 四 种 : 


1. 前 序 壳 历 


规则 是 各 二叉树 为 空 ， 则 空 操作 返回 ， 人 否则 先 访问 根 结 点 ， 然 后 前 序 遇 
历 左 子 树 ， 再 前 序 吉 历 右 子 树 。 如 图 6-8-2 所 示 ， 裔 历 的 顺序 为 : 
ABDGH-CEIF 。 


ーー ーー ーー 一 


图 6-8-2 


2. HFR 





规则 是 若 树 为 空 ， 则 空 操作 返回 ， 和 否则 从 根 结 点 开始 《注意 并 不 是 先 访 
问 根 结 点 ) ， 中 序 通 历 根 结 点 的 左 子 树 ， 然 后 是 访问 根 结 点 ， 最 后 中 序 
裔 历 右 子 树 。 如 图 6-8-3 所 示 ， 授 历 的 顺序 为 : GDHBAE-ICF。 
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图 6-8-3 


3. 后 序 裔 历 


规则 是 耕 树 为 空 ， 则 空 操 作 人 返回 ， 否 则 从 左 到 右 先 叶 子 后 结 扣 的 方式 吉 
历 访 问 左 右 子 树 ， 最 后 是 访问 根 结 点 。 如 图 6-8-4 所 示 ， 避 历 的 顺序 为 : 
GHDBIEFCA. 





图 6-8-4 


4. AFEN 


Nl 


UUW EBM AZ, MERRE, BRUM, tate ae AIT 
台 访 问 ， 从 上 而 下 逐 层 遍历 ， 在 同一 层 中 ， 按 从 左 到 右 的 顺序 对 结 点 未 
个 访问 。 如 图 6-8-5 所 示 ， 裔 历 的 顺序 为 : ABCDEFGHI。 








图 6-8-5 


有 同学 会 说 ， 研 究 这 么 多 壳 历 的 方法 干什么 呢 ? 





我 们 用 图 形 的 方式 来 表现 树 的 结构 ， 应 该 说 是 非常 直观 和 容易 理解 ， 但 
古 对 于 计算 机 来 说 ， 它 只 有 循环 、 判 断 等 方式 来 处 理 ， 也 就 是 说 ， 它 只 
会 处 理 线性 序列 ， 而 我 们 刚才 提 到 的 四 种 过 有 历 方法 ， 其 实 都 是 在 把 树 中 
的 结 点 变 成 茶 种 意义 的 线性 序列 ， 这 就 给 程序 的 实现 带 来 了 好 处 。 





另外 不 同 的 遍历 提供 了 对 结 点 依次 处 理 的 不 同方 式 ， 可 以 在 遍历 过 程 中 
对 结 点 进行 各 种 处 理 。 


6.8.3 ”前 序 裔 历 算法 


二 又 树 的 定义 是 用 递归 的 方式 ， 所 以 ， 实 现 通 历 算法 也 可 以 采用 递归 ， 
而 且 极其 简洁 明了 。 先 来 看 看 二 又 树 的 前 序 遍 历 算法 。 代 码 如 下 : 








/二叉树 的 前 序 遍 历 递 归 算 法 */ 


void PreOrderTraverse(BiTree T) 





iff (A EB) 

return; 
/* 显示 结 点 数据 ， 可 以 更 改 为 其 他 对 结 点 操作 */ 
printf("%c", T->data); 
/* 再 先 序 裔 历 左 子 树 */ 
PreOrderTraverse(T->1chi1d ) / 
/* 最 后 先 序 遍 历 右 子 树 */ 


PreOrderTraverse(T->rchild) / 











假设 我 们 现在 有 如 图 6-8-6 这 样 一 棵 二 又 树 T。 这 树 已 经 用 二 又 链表 结构 
存储 在 内 存 当 中 。 


图 6-8-6 





那么 当 调用 PreOrderTraverse(T) 函 数 时 ， 我 们 来 看 看 程序 是 如 何 运 行 
的 。 


1. 调用 PreOrderTraverse(TJ)，TI 根 结 点 不 为 null， 所 以 执行 printf， 打 印 
字母 A， 如 图 6-8-7 所 示 。 


图 6-8-7 


2. 调用 PreOrderTraverse(T->lchild); 访 问 了 A 结 点 的 左 孩 子 ， 不 为 null， 
执行 printf 显 示 字 母 B， 如 图 6-8-8 所 示 。 


图 6-8-8 


3. 此 时 再 次 递归 调用 PreOrderTraverse(T->lchild); 访 问 了 B 结 点 的 左 孩 
子 ， 执 行 printf 显 示 字 母 D， 如 图 6-8-9 所 示 。 


图 6-8-9 


A. 再 次 递归 调用 PreOrderTraverse(T->lchild); 访 问 了 D 结 点 的 左 孩子 ， 执 
行 printf 显 示 字 母 H， 如 图 6-8-10 所 示 。 





图 6-8-10 


5. 再 次 递归 调用 PreOrderTraverse(T->lchild); 访 问 了 H 结 点 的 左 孩 子 ， 此 
时 因为 H 结 点 无 左 孩 子 ， 所 以 T==null， 返 回 此 函数 ， 此 时 递归 调用 
PreOrderTraverse(T->rchild); 访 问 了 H 结 点 的 右 孩 子 ，printf 显 示 字 母 K， 

如 图 6-8-11 所 示 。 





图 6-8-11 


6. 再 次 递归 调用 PreOrderTraverse(T->lchild); 访 问 了 K 结 点 的 左 孩 子 ，K 
结 点 无 左 孩 子 ， 返 回 ， 调 用 PreOrderTra-verse(T->rchild); 访 问 了 K 续 点 的 
右 孩 子 ， 也 是 null， 返 回 。 于 是 此 函数 执行 完毕 ， 返 回 到 上 一 级 递归 的 
函数 《〈 即 打印 也 结 点 时 的 函数 ) ， 也 执行 完毕 ， 返 回 到 打印 结 点 D 时 的 
函数 ， 调 用 PreOrderTraverse(T->rchild); 访 问 了 D 结 点 的 右 孩 子 ， 不 存 
在 ， 返 回 到 B 结 点 ， 调 用 PreOrderTra-verse(T->rchild); 找 到 了 结 点 E， 打 
印字 母 E， 如 图 6-8-12 所 示 。 








图 6-8-12 





7. 由 TA REZA AAT BERAE BIT A ER, 迎 月 抗生 
ETG 返回 到 最 初 的 PreOrderTraverse, 週 用 PreOrderTra-verse(T- 
>rchild); WZ RANA, 打 印 字母 C, 如 図 6-8-13 所 示 。 








图 6-8-13 


8. 之 后 类 似 前 面 的 递归 调用 ， 依 次 继续 打印 F、I、G、J， 步 又 略 。 





综 上 ， 前 序 裔 历 这 棵 二 叉 树 的 节点 顺序 是 : AB-DHKECFIGJ。 
Traverse(T) 函 数 时 ， 程 序 是 如 何 运行 的 。 


6.8.4 中 序 壳 历 算法 


那么 二 又 树 的 中 序 遇 历 算 法 是 如 何 呢 ? 哈哈 ， 别 以 为 很 复杂 ， 它 和 前 序 
避 历 算法 仅仅 只 是 代码 的 顺序 上 的 差异 。 











/* 二 叉 树 的 中 序 遍 历 递归 算法 */ 
void InOrderTraverse(BiTree T) 
{ 
iff Gea =a NU) 
return; 
/* 中 序 遍历 左 子 树 */ 
Tnondermnavers erm: >1chi1d ) / 
/* 显示 结 点 数据 ， 可 以 更 改 为 其 他 对 结 点 操作 
niga '%c", T->data); 
/* 最 后 中 序 遍 历 右 子 树 */ 


InOrderTraverse(T->rchild) ; 


换 句 话说 ， 它 等 于 是 把 调用 左 孩 子 的 递归 函数 提前 了 ， 就 这 么 简单 。 我 
们 来 看 看 当 调用 InOrder-Traverse(T) 函 数 时 ， 程 序 是 如 何 运行 的 。 


1. 调用 InOrderTraverse(T)，T 的 根 结 点 不 为 null， 于 是 调用 

InOrderTraverse(T->lchild); 访 问 结 点 B。 当 前 指针 不 为 null， 继 续 调用 

InOrderTraverse(T->lchild); 访 问 结 点 D。 不 为 null， 继 续 调用 

InOrderTraverse(T->lchild); 访 问 结 点 H。 继 续 调 A Ee ee 

n 访问 结 点 再 的 左 孩 子 ， 发 现 当前 指针 为 null， 于 是 返回 。 打 印 当 
1 结 点 H， 如 图 6-8-14 所 示 。 


图 6-8-14 


2. 然后 调用 moOrderTraverse(T->rchild); 访 问 结 点 英 的 右 孩 子 K， 因 结 点 区 
无 左 孩 子 ， 所 以 打印 K， 如 图 6-8-15 所 示 。 


图 6-8-15 


AAA KIRA AT 所 以 返回 。 打 印 结 点 了 函数 执行 完毕 ， 返 
回 。 打 印字 母 D， 如 图 6-8-16 所 示 。 


图 6-8-16 


4. 结 点 D 无 右 孩 子 ， 此 函数 执行 完毕 ， 返 回 。 打 印字 母 B， 如 图 6-8-17 
所 示 。 


图 6-8-17 





5. 调用 ImOrderTraverse(T->rchild); 访 问 结 点 B 的 右 孩 子 E， 因 结 点 E 无 左 
孩子 ， 所 以 打印 E， 如 图 6-8-18 所 示 。 


图 6-8-18 


6. 结 点 E 无 右 孩 子 ， 返 回 。 结 点 B 的 递归 函数 执行 完毕 ， 返 回 到 了 最 初 
我 们 调用 In-OrderTraverse 的 地 方 ， 打 印字 母 A， 如 图 6-8-19 所 示 。 





图 6-8-19 





7. 再 调用 InOrderTraverse(T->rchild); 访 问 结 点 A 的 右 孩 子 C， 再 递归 访 
问 结 点 C 的 左 孩子 F， 结 点 FE 的 左 孩 子 1。 因 为 I 无 左 孩 和子， 打印 I， 之 后 分 
别 打印 FE、C、G、J。 步 又 省 略 。 








综 上 ， 中 序 裔 历 这 棵 二 叉 树 的 节点 顺序 是 : HKDBEAIFCGJ。 


6.8.5 ”后 序 裔 历 算 法 








么 同样 的 ， 后 序 衣 历 也 就 很 容易 想到 应 该 如 何 写 代码 了 。 





/二叉树 的 后 序 遍 历 递归 算法 */ 


void PostOrderTraverse(BiTree T) 





ny SS NY 
return; 
/* 先后 序 遍历 左 子 树 */ 
PostOrderTraverse(T->1chi1d ) / 
/* 再 后 序 裔 历 右 子 树 */ 
Poe ee SOLTE >rchi td), 
/* 显示 结 点 数据 ， 可 以 更 改 为 其 他 对 结 点 操作 */ 
printf("%c", T->data); 


























如 图 6-8-20 所 示 ， 后 序 遍 历 是 先 递 归 左 子 树 ， 由 根 结 点 AB-D-H,， 
HAHAE BZT, BREARHNABRLK, ANAAKCAABST, M 
以 打 印 K, 返 回 。 


图 6-8-20 


最 终 ， 后 序 遍 历 的 结 点 的 顺序 就 是 ， KHDEB-IFJGCA。 同学 休 可以 自己 
按照 刚才 的 办 法 得 出 这 个 结果 。 


6.8.6 ”推导 裔 历 结 


有 一 种 题目 为 了 考查 你 对 二 叉 树 遍历 的 掌握 程度 ， 是 这 样 出 题 的 。 己 知 
一 棵 二 又 树 的 前 序 人 遍历 序列 为 ABCDEF， 中 序 遍 历 序列 为 CBAEDF， 请 
问 这 棵 三 又 树 的 后 序 遍 历 结 果 是 多 少 ? 





对 于 这 样 的 题目 ， 如 果真 的 完全 理解 了 前 中 后 序 的 原理 ， 是 不 难 的 。 


三 种 遍历 都 是 从 根 结 点 开始 ， 前 序 遍 历 是 先 打 印 再 递归 左 和 右 。 所 以 前 
序 裔 历 序 列 为 ABCDEF， 第 一 个 字母 是 A 被 打印 出 来 ， 就 说 明 A 是 根 结 
点 的 数据 。 再 由 中 序 遍 历 序列 是 CBAEDF， 可 以 知道 C 和 B 是 A 的 左 子 树 
的 结 点 ，E、D、F 是 A 的 右 子 树 的 结 点 ， 如 图 6-8-21 所 示 。 





图 6-8-21 


然后 我 们 看 前 序 中 的 C 和 B， 它 的 顺序 是 ABCDEF， 是 先 打印 B 后 打印 
C， 所 以 B 应 该 是 A 的 左 孩子 ， 而 C 就 只 能 是 B 的 孩子 ， 此 时 是 左 还 是 右 
孩子 还 不 确定 。 再 看 中 序 序列 是 CBAEDF，C 是 在 B 的 前 面 打印 ， 这 就 
说 明 C 征 B 的 左 孩子 ， 否 则 就 是 右 孩 子 了 ， 如 几 6-8-22 所 示 。 











图 6-8-22 





再 看 前 序 中 的 E、D、F， 它 的 顺序 是 ABCDEF， 那 就 意味 着 D 是 A 结 点 
的 右 孩 子 ，E 和 FE 是 D 的 子孙 ， 注 意 ， 它 们 中 有 一 个 不 一 定 是 孩子 ， 还 有 
可 能 是 孙子 的 。 再 来 看 中 序 序列 是 CBAEDF， 由 于 E 在 D 的 左 侧 ， 而 F 在 
右 侧 ， 所 以 可 以 确定 E 是 D 的 左 孩 子 ，F 是 D 的 右 孩 子 。 因 此 最 终 得 到 的 
二 义 树 是 图 6-8-23 所 示 。 








图 6-8-23 


为 了 避免 推导 中 的 失误 ， 你 最 好 在 心中 递归 遍历 ， 检 查 一 下 这 棵 树 的 前 





序 和 中 序 过 历 序列 是 否 与 题目 中 的 相同 。 





己 经 复原 了 二 又 树 ， 要 获得 它 的 后 序 电 有 历 结果 就 是 易如反掌 ， 结 果 是 
CBEFDA。 


但 其 实 ， 如 果 同 学 们 足够 熟练 ， 不 用 画 这 棵 二 叉 树 ， 也 可 以 得 到 后 序 的 
结果 ， 因 为 刚才 判断 了 A 结 点 是 根 结 点 ， 那 么 它 在 后 序 序列 中 ， 一 定 是 
最 后 一 个 。 刚 才 推导 出 C 是 B 的 左 孩 子 ， 而 B 是 A 的 左 孩子 ， 那 就 意味 着 
后 序 序列 的 前 两 位 一 定 是 CB。 同 样 的 办 法 也 可 以 得 到 EFD 这 样 的 后 序 
顺序 ， 最 终 就 自然 的 得 到 CBEFDA 这 样 的 序列 ， 不 用 在 草稿 上 画 树 状 图 





反 过 来 ， 如 果 我 们 的 题目 是 这 样 : 二 又 树 的 中 序 序列 是 ABCDEFG， 后 
序 序列 是 BDCAFGE， 求 前 序 序列 。 


这 次 简单 点 ， 由 后 序 的 BDCAFGE， 得 到 E 是 根 结 点 ， 因 此 前 序 首 字 
日 
FEE 





于 是 根据 中 序 序列 分 为 两 棵 树 ABCD 和 FG， 由 后 序 序列 的 BDCAFGE， 
知道 A 是 E 的 左 孩 子 ， 前 序 序列 目前 分 析 为 EA。 








再 由 中 序 序列 的 ABCDEFG， 知 道 BCD 是 A 结 点 的 右 子 孙 ， 再 由 后 序 序 
列 的 BDCAEFGE 知 道 C 结 点 是 A 结 点 的 右 孩 子 ， 前 序 序列 目前 分 析 得 到 
EAC。 


中 序 序列 ABCDEFG， 得 到 B 是 C 的 左 孩 子 ，D 是 C 的 右 护 子 ， 所 以 前 序 
序列 目前 分 析 结 果 为 EACBD。 














由 后 序 序列 BDCAFGE， 得 到 G 是 E 的 右 孩 子 ， 于 是 F 就 是 G 的 孩子 。 如 
果 你 是 在 考试 时 做 这 道 题 目 ， 时 间 就 是 分 数 、 名 次 、 学 历 ， 那 么 你 根本 
不 需 关 心 F 是 G 的 左 还 是 右 孩 子 ， 前 序 裔 历 序列 的 最 终结 果 就 是 





EACBDGF。 





不 过 细 细 分 析 ， 根 据 中 序 序列 ABCDEFG， 是 可 以 得 出 F 是 G 的 左 孩子 。 


从 这 里 我 们 也 得 到 两 个 二 又 树 过 历 的 性 质 。 


。 已 知 前 序 过 历 序 列 和 中 序 遍 历 序列 ， 可 以 唯一 确定 一 柠 二 又 树 。 
。 已 知 后 序 通 历 序 列 和 中 序 遍 历 序列 ， 可 以 唯一 确定 一 柠 二 又 树 。 


但 要 注意 了 ， 已 知 前 序 和 后 序 遍 历 ， 是 不 能 确定 一 棵 二 又 树 的 ， 原 因 也 
很 简单 ， 比 如 前 序 序列 是 ABC， 后 序 序列 是 CBA。 我 们 可 以 确定 A 一 定 
是 根 结 点 ， 但 接 下 来 ， 我 们 无 法 知道 ， 哪 个 结 点 是 左 子 树 ， 哪 个 是 右 子 
树 。 这 棵 树 可 能 有 如 图 6-8-24 所 示 的 四 种 可 能 。 


图 6-8-24 





6.9 ”二叉树 的 建立 


说 了 半天 ， 我 们 如 何在 内 存 中 生成 一 棵 二 又 链表 的 二 又 树 呢 ? 树 都 没 
有 ， 哪 来 届 历 。 所 以 我 们 还 得 来 谈 谈 关于 二 又 树 建 立 的 问题 。 


如 果 我 们 要 在 内 存 中 建立 一 个 如 图 6-9-1 左 图 这 样 的 树 ， 为 了 能 让 每 个 结 
点 确认 是 否 有 左右 孩子 ， 我 们 对 它 进行 了 扩展 ， 变 成 图 6-9-1 右 图 的 样 
子 ， 也 就 是 将 二 叉 树 中 每 个 结 点 的 空 指针 引出 一 个 虚 结 点 ， 其 值 为 一 特 
定 值 ， 比 如 “ 拓 。 我 们 称 这 种 处 理 后 的 二 又 树 为 原 二 叉 树 的 扩展 二 又 
树 。 扩 展 二 又 树 就 可 以 做 到 一 个 遍历 序列 确定 一 棵 二 叉 树 了 。 比 如 图 6- 
9-1 的 前 序 授 历 序列 就 为 AB#D##C##。 








扩展 二 又 


图 6-9-1 


有 了 这 样 的 准备 ， 我 们 就 可 以 来 看 看 如 何 生成 一 标 二 又 树 了 。 假 设 二 又 
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挨个 输入 。 实 现 的 算法 如 下 : 


/* 按 前 序 输入 二 又 树 中 结 点 的 值 《 一 个 字符 ) */ 
/* # 表 示 空 树 ， 构 造 二 又 链表 表示 二 叉 树 T。 */ 


void CreateBiTree(BiTree *T) 





TElemType ch; 
Scan (CCE 


if (ch == '#') 
STENU [ale 
else 
{ 
*T = (BiTree)malloc(sizeof(BiTNode) ); 
a CURE 
exit (OVERFLOW); 


/* 生成 根 结 点 */ 

(*T)->data = ch; 

/* 构造 左 子 树 */ 
CreateBiTree(&(*T)->lchild); 
/* 构造 右 子 树 */ 
CreateBiTree(&(*T)->rchild) ; 











其 实 建立 二 叉 树 ， 也 是 利用 了 递归 的 原理 。 只 不 过 在 原来 应 该 是 打印 结 
点 的 地 方 ， 改 成 了 生成 结 点 、 给 结 点 赋值 的 操作 而 已 。 所 以 大 家 理解 了 
前 面 的 换 历 的 话 ， 对 于 这 段 代码 残 不 难 理解 了 。 





6.10 ”线索 二 又 树 
6.10.1 线索 二 又 树 原 理 


我 们 现在 提倡 市 约 型 社会 ， 一 切 都 应 该 节约 为 本 。 对 等 我 们 的 程序 当然 
也 不 例外 ， 能 不 浪费 的 时 间或 空间 ， 都 应 该 考虑 节省 。 我 们 再 来 观察 图 
6-10-1， 会 发 现 指针 域 并 不 是 都 充分 的 利用 了 ， 有 许 许多 多 的 “人 ”， 也 
就 是 空 指针 域 的 存在 ， 这 实在 不 是 好 现象 ， 应 该 要 想 办 法 利用 起 来 。 





AN o gieh 
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图 6-10-1 


首先 我 们 要 来 看 看 这 空 指 针 有 多 少 个 呢 ? 对 于 一 个 有 n 个 结 点 的 二 又 链 
表 ， 每 个 结 点 有 指 癌 左右 孩子 的 两 个 指针 域 ， 所 以 一 共 是 2n 个 指针 域 。 
而 n 个 结 点 的 三 叉 树 一 共有 n-1 条 分 支线 数 ， 也 就 是 说 ， 其 实 是 存在 2n- 
(n-1)=n 十 1 个 空 指 针 域 。 比 如 图 6-10-1 有 10 个 结 点 ， 而 带 有 “人 和 八 ” 空 指针 域 
为 11。 这 些 空间 不 存储 任何 事物 ， 白 白 的 浪费 着 内 存 的 资源 。 











另 一 方面 ， 我 们 在 做 遍历 时 ， 比 如 对 图 6-10-1 做 中 序 遍 历时 ， 得 到 了 
HDIBEJAFCG 这 样 的 字符 序列 ， 遍 历 过 后 ， 我 们 可 以 知道 ， 结 点 I 的 前 
驱 是 D， 后 继 是 B， 结 点 F 的 前 驱 是 A， 后 继 是 C。 也 就 是 说 ， 我 们 可 以 
很 清楚 的 知道 任意 一 个 结 点 ， 它 的 前 驱 和 后 继 是 哪 一 个 。 








可 是 这 是 建立 在 已 经 过 有 历 过 的 基础 之 上 的 。 在 二 又 链表 上 ， 我 们 只 能 知 
道 每 个 结 点 指向 其 左右 孩子 结 点 的 地 址 ， 而 不 知道 某 个 结 点 的 前 驱 是 
谁 ， 后 继 是 谁 。 要 想 知 道 ， 必 须 志 历 一 次 。 以 后 每 次 需要 知道 时 ， 痢 必 
须 先 过 历 一 次 。 为 什么 不 考虑 在 创建 时 就 记 住 这 些 前 驱 和 后 继 呢 ， 那 将 
是 多 大 的 时 间 上 的 市 省 。 





综合 刚才 两 个 角度 的 分 析 后 ， 我 们 可 以 考虑 利用 那些 空地 址 ， 存 放 指 癌 
结 点 在 某 种 遍历 次 序 下 的 前 驱 和 后 继 结 点 的 地 址 。 就 好 像 GPS 导 航 仪 一 
样 ， 我 们 开车 的 时 候 ， 哪 怕 我 们 对 有 具体 目的 地 的 位 置 一 无 所 知 ， 但 它 每 
次 都 可 以 告诉 我 从 当前 位 置 的 下 一 步 应 该 走 同 哪 里 。 这 就 是 我 们 现在 要 
研究 的 问题 。 我 们 把 这 种 指向 前 驱 和 后 继 的 指针 称 为 线索 ， 加 上 线索 的 
二 义 链表 称 为 线索 链表 ， 相 应 的 二 又 树 就 称 为 线索 二 又 树 (Threaded 
Binary Tree) 。 





请 看 图 6-10-2， 我 们 把 这 棵 二 又 树 进行 中 序 过 历 后 ， 将 所 有 的 空 指 针 域 
中 的 rchild， 改 为 指 同 它 的 后 继 结 点 。 于 是 我 们 就 可 以 通过 指针 知道 英 的 
EED (AFO) ，I 的 后 继 是 B〈 图 中 忆 ) ，J 的 后 继 是 E《〈 图 中 
©), EWKA (KAFO) ，E 的 后 继 是 C《〈 图 中 名) ，G 的 后 继 因 
为 不 存在 而 指向 NULL (KAFO) 。 此 时 共有 6 个 空 指 针 域 被 利用 。 





图 6-10-2 


再 看 图 6-10-3， 我 们 将 这 棵 二 叉 树 的 所 有 空 指针 域 中 的 lchild， 改 为 指向 
当前 结 点 的 前 驱 。 因 此 H 的 前 驱 是 NULL (KIFO) ，I 的 前 驱 是 D (图 

中 ②) ，J 的 前 驱 是 B (RHQ) ，F 的 前 驱 是 A (KFO) ，G 的 前 驱 是 
c (AAO) 。 一 共 5 个 空 指针 域 被 利用 ， 正 好 和 上 面 的 后 继 加 起 来 是 11 


|-。 





图 6-10-3 


通过 图 6-10-4《〈《 衬 心 箭头 实 线 为 前 驱 ， 虚 线 黑 箭头 为 后 继 ) ， 就 更 容易 
看 出 ， 其 实 线索 二 又 树 ， 等 于 是 把 一 柠 二 又 树 转变 成 了 一 个 双 辐 链表 ， 

这 样 对 我 们 的 插入 删除 结 点 、 碍 找 茶 个 络 氮 都 带 来 了 方便 。 所 以 我 们 对 
二 叉 树 以 某 种 次 序 壳 历 使 其 变 为 线索 二 叉 树 的 过 程 称 做 是 线索 化 。 
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图 6-10-4 


不 过 好 事 总 是 多 磨 的 ， 问 题 并 没有 彻底 解雇 。 我 们 如 何 知道 某 一 结 点 的 
lchild 是 指向 它 的 左 孩子 还 是 指向 前 驱 ? rchild 是 指向 右 孩子 还 是 指向 后 
继 ? 比如 E 结 点 的 lchild 是 指向 它 的 左 孩 子 J， 而 rchild 却 是 指向 它 的 后 继 


AA 
A。 显 然 我 们 在 诀 定 lchild 是 指向 左 孩 子 还 是 前 驱 ，rchild 是 指向 右 孩子 
是 需要 一 个 区 分 标志 的 。 因 此 ， 我 们 在 每 个 结 点 再 增设 两 个 


还 是 后 继 上 是 需要 
标志 域 ltag 和 rtag， 注 意 ltag 和 rtag 只 是 存放 0 或 1 数字 的 布尔 型 变量 ， 其 占 
用 的 内 存 空 间 要 小 于 像 Ichild 和 rchild 的 指针 变量 。 结 点 结构 如 表 6-10-1 




















所 示 。 


表 6-10-1 


其 中 : 








。 ltag 为 0 时 指 癌 该 结 点 的 左 孩 子 ， 为 1 时 指向 该 结 反 的 前 驱 。 





e rtag 为 0 时 指向 该 结 点 的 右 孩 子 ， 为 1 时 指向 该 结 点 的 后 继 。 
e 因此 对 于 图 6-10-1 的 二 又 链表 图 可 以 修改 为 图 6-10-5 的 样子 。 





6.10.2 ”线索 二 又 树 结构 实现 


由 此 三 又 树 的 线索 存储 结构 定义 代码 如 下 : 











/* 二 义 树 的 二 又 线索 存储 结构 定义 */ 

/* Link==9 表 示 指 向 左右 孩子 指针 */ 

/* Thread==1 表 示 指 向 前 驱 或 后 继 的 线索 */ 
typedef enum {Link, Thread} PointerTag; 
/* 二 叉 线索 存储 结 点 结构 */ 

typedef struct BiThrNode 

d 


/* 结 点 数据 */ 

TElemType data; 

EIR A 

struct BiThrNode *lchild, *rchild; 
PointerTag LTag; 

/* 左右 酸 志 */ 

PointerTag RTag; 

} BiThrNode, *BiThrTree; 
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由 于 前 驱 和 后 继 的 信息 只 有 在 遍历 该 二 又 树 时 才能 得 到 ， 所 以 线索 化 的 
过 程 就 是 在 所 历 的 过 程 中 修改 空 指针 的 过 程 。 


中 序 志 有 历 线索 化 的 递归 函数 代码 如 下 : 


BiThrTree pre; /* 全 局 变量 ， 始 终 指 向 刚刚 访问 过 的 结 点 */ 
/* 中 序 遍 历 进行 中 序 线索 化 */ 
void InThreading(BiThrTree p) 


if (p) 
{ 


/* 递归 左 子 树 线索 化 */ 
InThreading(p->lchild); 
M 7, 

if (!p->lchild) 























/* 前 驱 线索 */ 

p->LTag = Thread: 

/* 左 孩子 指针 指向 前 驱 */ 
p->lchild = pre; 


} 
/* 前 驱 没有 右 孩 子 */ 
if (!pre->rchild) 


/* JRRARR */ 


pre->RTag = Thread; 
/* 前 驱 右 孩子 指针 指向 后 继 〈 当 前 结 点 p) */ 
pre->rchild = p; 








is 

/* 保持 pre 指 向 p 的 前 驱 */ 
pre = p; 

/* 递归 右 子 树 线索 化 */ 
InThreading(p->rchild); 


t 
+ 


你 会 发 现 ， 这 代码 除 加 粗 代 码 以 外 ， 和 二 又 树 中 序 遍 历 的 递归 代码 几乎 
完全 一 样 。 只 不 过 将 本 是 打印 结 点 的 功能 改 成 了 线索 化 的 功能 。 


中 间 加 粗 部 分 代码 是 做 了 这 样 的 一 些 事 。 


if(1p->lchild) 表 示 如 果菜 结 点 的 左 指针 域 为 宇 ， 因 为 其 前 驱 结 点 刚刚 访 
问 过 ， 赋 值 给 了 pre， 所 以 可 以 将 pre 赋 值 给 p->lchild， 并 修改 p- 
>LTag=Thread (也 就 是 定义 为 1) 以 完成 前 驱 结 点 的 线索 化 。 


后 继 束 要 稍稍 奔 烦 一 些 。 因 为 此 时 p 结 点 的 后 继 还 没有 访问 到 ， 因 此 只 
能 对 它 的 前 驱 结 点 pre 的 右 指针 rchild 做 判断 ，if(!pre->rchild) 表 示 如 果 为 
空 ， 则 p 就 是 pre 的 后 继 ， 于 是 pre->rchild=p， 并 且 设 置 pre- 
>RTag=Thread， 完 成 后 继 结 点 的 线索 化 。 


完成 前 驱 和 后 继 的 判断 后 ， 别 忘记 将 当前 的 结 点 p 赋 值 给 pre， 以 便于 下 
一 次 使 用 。 





有 了 线索 二 又 树 后， 我 们 对 它 进行 过 历时 发 现 ， 其 实 就 等 于 是 操作 一 个 
双 问 链表 结构 。 


和 双 问 链表 结构 一 样 ， 在 二 叉 树 线索 链表 上 添加 一 个 头 结 点 ， 如 图 6-10- 
6 所 示 ， 并 令 其 lchild 域 的 指针 指向 二 又 树 的 根 结 点 “图 中 的 D) , 其 
rchild 域 的 指針 指向 中 序 過 万 時 坊 回 的 最 后 一 介 希 点 ( 図 中 的 ②) 。 反 
之 ， 令 二 又 树 的 中 序 序列 中 的 第 一 个 结 点 中 ，lchild 域 指针 和 最 后 一 个 
结 点 的 rchild 域 指针 均 指 向 头 结 点 (图 中 的 @ 和 G@))〉 。 这 样 定 义 的 好 处 








Bre ANI BE AT UAE Sa AEC RE AT A, 也 可 以 人 最 后 一 介 策 
点 起 顺 前 驱 进行 过 历 。 





志 历 的 代码 如 下 : 


/* T 指 向 头 结 点 ， 头 结 点 左 链 lchild 指 向 根 结 点 ， 
头 结 点 右 链 rchild 指 向 中 序 遍 历 的 */ 

/* 最 后 一 个 结 点 。 中 序 遍 历 二 叉 线索 链表 表示 的 二 
叉 樹 T */ 

Status InOrderTraverse_Thr(BiThrTree T) 

















BiThrTree p; 

/* p 指 向 根 结 点 */ 

p = T->lchild; 

/* 衬 树 或 遍历 结束 时 ，p==T */ 

while (p != T) 
/* 当 LTag==9 时 循环 到 中 序 序列 第 一 个 结 点 */ 
while (p->LTag == Link) 

p = p->lchild; 

/* 显示 结 点 数据 ， 可 以 更 改 为 其 他 对 结 点 操作 */ 
printf("%c", p->data); 
while (p->RTag == Thread && p->rchild != T) 











p = p->rchild; 
printf("%c", p->data); 











8 
/* p 进 至 其 右 子 树 根 */ 
p = p->rchild; 





} 


return OK; 


} 


1. 代 码 中 ， 第 4 行 ，p=T->lchild: 意 思 就 是 图 6-10-6 中 的 QD， 让 p 指 向 根 结 
点 开始 遍历 。 

2. 第 5 一 16 行 ，while(p!= 了 其 实意 思 就 是 循环 直到 图 中 的 由 的 出 现 ， 此 时 
意味 着 p 指 向 了 头 结 点 ， 于 是 与 T 相 等 〈IT 是 指向 头 结 点 的 指针 ) ， 结 束 
循环 ， 否 则 一 直 循 环 下 去 进行 遍历 操作 。 

3. 第 7 一 8 行 , while(p->LTag==Link)ixX MAM, HEHASBSD-H, 此 
时 H 结 点 的 LTag 不 是 Link〈 就 是 不 等 于 0) ， 所 以 结束 此 循环 。 

4. 第 9 行 , 打 印 HH。 

5. 第 10 一 14 行 , while(p->RTag==Thread&&p->rchild!=T), H F2 SHIM 
RTag==Thread 〈 就 是 等 于 1) ， 且 不 是 指向 头 结 点 。 因 此 打印 H 的 后 继 
D， 之 后 因为 D 的 RTag 是 Link， 因 此 退出 循环 。 

6. 第 15 行 ，p=p->rchild; 意 味 着 p 指 同 了 结 点 D 的 右 孩 子 I。 

pe ， 就 这 样 不 断 循环 遍历 ， 路 径 参 照 图 6-10-4， 直 到 打印 出 
HDIBJEAFCG， 结 束 遍 历 操作 。 




















Nik BSE A VG, ES Pe NERKA, Fr DANY Ta) 3 28 RE 
O(n). 


由 于 它 充 分 利用 了 空 指针 域 的 空间 (这 等 于 节省 了 空间 〉， 叉 保证 了 创 
建 时 的 一 次 损 历 就 可 以 终生 受用 前 驱 后 继 的 信息 〈 这 意味 痢 贡 省 了 时 
间 ) 。 所 以 在 实际 问题 中 ， 如 果 所 用 的 三 叉 树 需 经 第 所 历 或 查找 结 反 时 
再 要 茶 种 通 历 序列 中 的 前 驱 和 后 继 ， 那 么 采用 线索 二 又 链表 的 存储 结构 
就 是 非常 不 错 的 选择 。 











6.11 树 、 和 森林 与 二 叉 树 的 转换 








我 之 前 在 网 上 看 到 这 样 一 个 故事 ， 不 知道 是 真 还 是 假 ， 反 正 是 有 点 意 
ane 


故事 是 说 联合 利 华 引进 了 一 条 香 时 包 闭 生产 线 ， 结 果 发 现 这 条 生产 线 有 
个 缺陷 : 常常 会 有 盒子 里 没 装 入 香 旺 。 总 不 能 把 空 盒子 卖 给 顾客 啊 ， 他 
们 只 好 请 了 一 个 学 目 动 化 的 博士 设计 一 个 方案 来 分 拣 空 的 香 星 会。 博士 
组 织 成 立 了 一 个 十 几 人 人 的 科研 攻关 小 组 ， 综 合 采 用 了 机 械 、 微 电子 、 自 
动 化 、X 射 线 探 训 等 技术 ， 花 了 几 十 万 ， 成 功 解决 了 问题 。 每 当 生产 线 
TN 








中 国 南方 有 个 乡镇 企业 也 买 了 同样 的 生产 线 ， 老 板 发 现 这 个 问题 后 大 为 
交火 ， 找 了 个 小 工 来 说 : PIE Sal fae, NAEP. AT 
很 快 想 出 了 办 法 : 他 在 生产 线 劳 边 放 了 台风 局 猛 吹 ， 空 忆 盒 自然 会 被 吹 


O 





这 个 故事 在 网 上 引起 了 很 大 的 争议 ， 我 相信 大 家 听 完 后 也 会 有 不 少 的 想 
法 。 不 过 我 在 这 只 是 想 说 ， 有 很 多 复杂 的 问题 都 是 可 以 有 简单 办 法 去 处 
理 的 ， 在 于 你 肯 不 肯 动 脑筋 ， 在 于 你 有 没有 创新 。 





我 们 前 面 已 经 讲 过 了 树 的 定义 和 存储 结构 ， 对 于 树 来 说 ， 在 满足 树 的 条 
件 下 可 以 是 任意 形状 ， 一 个 结 点 可 以 有 任意 多 个 孩子 ， 显 然 对 树 的 处 理 
要 复杂 得 多 ， 去 研究 关于 树 的 性 质 和 算法 ， 真 的 不 容易 。 有 没有 简单 的 
办 法 解决 对 树 处 理 的 难题 呢 ? 














我 们 前 面 也 讲 了 二 又 树 ， 尽 管 它 也 是 树 ， 但 由 于 每 个 结 点 最 多 只 能 有 左 
孩子 和 右 孩 子 ， 面 对 的 变化 就 少 很 多 了 。 因 此 很 多 性 质 和 算法 都 被 研究 
和 
以 这 样 做 。 








图 6-11-1 


在 讲 树 的 存储 结构 时 ， 我 们 提 到 了 树 的 孩子 兄弟 法 可 以 将 一 棵 树 用 二 又 
链表 进行 存储 ， 所 以 借助 二 又 链表 ， 树 和 二 又 树 可 以 相互 进行 转换 。 从 
物理 结构 来 看 ， 它 们 的 二 又 链表 也 是 相同 的 ， 只 是 解释 不 太一 样 而 已 。 











因此 ， 只 要 我 们 设 定 一 定 的 规则 ， 用 二 又 树 来 表示 树 ， 甚 至 表示 和 森林 都 
是 可 以 的 ， 和 森林 与 二 又 树 也 可 以 互相 进行 转换 。 


我 们 分 别 来 看 看 它们 之 间 的 转换 如 何 进行 。 


6.11.1 MHRA VE 





将 树 转换 为 二 又 树 的 步骤 如 下 1. 加 线 。 在 所 有 兄弟 结 点 之 间 加 一 条 连 
线 。 2. 去 线 。 对 树 中 每 个 结 点 ， 只 保留 它 与 第 一 个 孩子 结 点 的 连 线 ， 删 
除 它 与 其 他 孩子 结 点 之 间 的 连 线 。 3. 层 次 调整 。 以 树 的 根 结 点 为 轴 心 ， 
将 整 标 树 顺 时 针 旋 转 一 定 的 角度 ， 使 之 结构 层次 分 明 。 注 意 第 一 个 孩子 
古 二 又 树 结 氮 的 左 孩子 ， 兄 弟 转 换 过 来 的 孩子 是 结 点 的 右 孩 子 。 





例如 图 6-11-2， 一 棵 树 经 过 三 个 步骤 转换 为 一 棵 二 叉 树 。 初 学 者 容易 犯 
的 错误 就 是 在 层次 调整 时 ， 弄 错 了 左右 孩子 的 关系 。 比 如 图 中 F、G 本 
都 是 树 结 点 B 的 孩子 ， 是 结 点 E 的 兄弟 ， 因 此 转换 后 ，F 就 是 二 又 树 结 点 
E 的 右 孩 子 ，G 是 二 又 树 结 点 E 的 右 孩 子 。 





i FRL: HEME, 


步骤 2， 给 除 长 子 外 的 孩子 去 线 步骤 3， 层 次 调整 


图 6-11-2 
6.11.2 AMEN A 


森林 是 由 奉 干 哥 树 组 成 的 ， 所 以 完全 可 以 理解 为 ， 森 林 中 的 每 一 标 树 都 
征 兄 第 ， 可 以 按照 兄弟 的 处 理 办 法 来 操作 。 步 又 如 下 : ”1. 把 每 个 树 转 换 
为 二 又 树 。 2. 第 一 村 二 广 树 不 动 ， 从 第 二 标 二 广 树 开始 ， 依 次 把 后 一 模 
二 义 树 的 根 结 点 作为 前 一 樟 二 叉 树 的 根 结 点 的 右 孩 子 ， 用 线 连 接 起 来 。 
当 所 有 的 二 叉 树 连接 起 来 后 束 得 到 了 由 和 森林 转换 来 的 二 叉 树 。 





例如 图 6-11-3， 将 森林 的 三 棵 树 转 化 为 一 棵 二 又 树 。 
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DR: 将 所 有 二 义 机 转换 为 一 哥 二 村 


图 6-11-3 


6.11.3 二叉树 转 换 为 树 


二 又 树 转 换 为 树 是 树 转换 为 二 又 树 的 逆 过 程 ， 也 束 是 反 过 来 做 而 已 。 如 
图 6-11-4 所 示 。 步 又 如 下 : ”1. 加 线 。 若 某 结 点 的 左 孩子 结 点 存在 ， 则 将 
这 个 左 孩 子 的 右 孩 子 结 点 、 右 孩子 的 右 孩 子 结 点 、 右 孩子 的 右 孩 子 的 右 
孩子 结 点 .…... 喻 ， 肥 正 就 是 左 孩 子 的 n 个 右 孩子 结 扣 部 作 为 此 结 皮 的 孩 
子 。 将 该 结 点 与 这 些 右 孩子 结 点 用 线 连接 起 来 。 2. 去 线 。 删 除 原 二 又 树 
中 所 有 结 点 与 其 右 孩 子 结 点 的 连 线 。 3. 层 次 调整 。 使 之 结构 层次 分 明 。 














\ 


步骤 1， 加 线 


XH 


DR): 去 线 OWS: 层次 调整 


图 6-11-4 
6.11.4 二 又 树 转换 为 森林 


判断 一 棵 二 又 树 能 够 转换 成 一 棵 树 还 是 森林， 标准 很 简单 ， 那 就 是 只 要 
看 这 株 二 又 树 的 根 结 点 有 没有 右 孩 子 ， 有 就 是 和 森林， 没有 融 是 一 析 树 。 
那么 如 果 是 转换 成 和 森林， 步骤 如 下 : ”1. 从 根 结 点 开始 ， 若 右 孩 子 存 在 ， 
则 把 与 右 孩 子 结 点 的 连 线 删 除 ， 再 但 看 分 离 后 的 二 叉 树 ， 厦 右 孩 子 存 
E, MERMER... 直到 所 有 右 孩 子 连 线 都 删除 为 止 ， 得 到 分 离 的 二 
叉 樹 。 2. 再 将 每 哥 分 离 后 的 二 文 树 转换 为 树 即 可 。 








步骤 2， 将 分 离 的 二 又 树 转换 成 权 


图 6-11-5 


6.11.5 树 与 森林 的 裔 历 


最 后 我 们 再 谈 一 谈 关 于 树 和 和 森林 的 过 历 问题 。 


树 的 遍历 分 为 两 种 方式 。 1. 一 种 是 先 根 遍历 树 ， 即 先 访问 树 的 根 结 点 ， 
然后 依次 先 根 遍 历 根 的 每 棵 子 树 。 2. 另 一 种 是 后 根 遍 历 ， 即 先 依次 后 根 
遍历 每 棵 子 树 ， 然 后 再 访问 根 结 点 。 比 如 图 6-11-4 中 右 下 方 的 树 ， 它 的 
先 根 遍历 序列 为 ABEFCDG， 后 根 遍 历 序列 为 EFBCGDA。 








森林 的 遍历 也 分 为 两 种 方式 : 1. 前 序 遍 历 : 先 访问 森林 中 第 一 棵 树 的 根 
ZH, FRG RRR TCA a RA BR Oe, 再 依 次 用 同 欄 方 式 刀 万 除去 
第 一 棵 树 的 剩余 树 构成 的 木林。 比如 图 6-11-5 下 面 三 棵 树 的 森林 ， 前 序 
遍历 序列 的 结果 就 是 ABCDEFGHJI。 2. 后 序 遍历 : 是 先 访 问 森林 中 第 一 
棵 树 ， 后 根 遍 历 的 方式 遍历 每 棵 子 树 ， 然 后 再 访问 根 结 点 ， 再 依次 同样 
方式 遍历 除去 第 一 棵 树 的 剩余 树 构成 的 森林 。 比 如 图 6-11-5 下 面 三 棵 树 
的 森林 ， 后 序 遍历 序 列 的 结果 就 是 BCDAFEJHIG 。 











可 如 宋 我 们 对 图 6-11-5 的 堪 侧 二 又 树 进行 分 析 就 会 发 现 ， 和 森林 的 前 序 过 
OO 
ZERE. 


XERE VRB, AA LEREN TEA, BSG ae A ea 
IRE Fe BY ME H SO S Br A R ea ERK IE 
实 也 惑 证 实 ， 我 们 找到 了 对 树 和 和 森林 这 种 复杂 问题 的 简单 解决 办 法 。 


6.12 HREM REA 
6.12.1 KS 


“UR, 兄弟 , BALTES, ARATABR A? ”我 这 有 《三 国 演 
义 》 的 电子 书 ， 你 要 不 要 ? BEAL Say, 何 生 発 。* 《 三 国 演 又 》 EE, 
你 邮件 发 给 我 ! OK! 文件 IM 多 大 小 ， 好 像 大 了 点。 我 打 个 包 ， 各 
等 …… 哈 哈 ， 少 了 一 半 ， 压 缩 效 果 不 错 呀 。” 太 棒 了 ， 快 点 传 给 我 


OER are 1208 KB 
=H zip 。 WinRARZP ERRE 682KB 


图 6-12-1 


这 是 我 们 生活 中 第 见 的 对 白 。 现 在 我 们 都 是 讲 完 效率 的 社会 ， 什 么 都 要 
求 速度 ， 在 不 能 出 错 的 情 念 他 的 成 束 ， 于 是 束 把 他 在 编码 中 用 到 的 特殊 
的 二 叉 树 称 之 为 赫 夫 曼 树 ， 他 的 编码 方法 称 为 赫 夫 曼 编 码 。 也 就 是 说 ， 

我 们 现在 介绍 的 知识 全 都 来 目 于 近 60 年 前 这 位 伟大 科学 家 的 研究 成 果 ， 

而 我 们 平时 所 用 的 压缩 和 解压 缩 技术 也 都 是 基于 苦 夫 曼 的 研究 之 上 发 展 
而 来 ， 我 们 应 该 要 记 住 他 。 





那么 压缩 而 不 出 错 是 如 何 做 到 的 呢 ? 简 单 说 ， 束 是 把 我 们 要 压缩 的 文本 
进行 重新 编码 ， 以 减少 不 必要 的 空间 。 尽 管 现在 最 新 技术 在 编码 上 已 经 
很 好 很 强大 ， 但 这 一 切 都 来 自 于 曾经 的 技术 积累 ， 我 们 今天 就 来 介绍 一 
下 最 基本 的 压 绚 编 码 方法 一 一 赫 夫 曼 编码 。 











在 介绍 赫 夫 曙 编 码 前 ， 我 们 必须 得 介绍 赫 夫 曼 树 ， 而 介绍 赫 夫 曼 树 ， 我 


NIAMS GEER PRA, REBAR (David Huffman) ， 也 有 
的 翻译 为 哈 夫 曼 。 他 在 1952 年 发 明了 赫 夫 曼 编码 ， 为 了 纪念 他 的 成 就 ， 
于 是 就 把 他 在 编码 中 用 到 的 特殊 的 二 叉 树 称 之 为 赫 夫 曼 树 ， 他 的 编码 方 
法 称 为 赫 夫 曼 编 码 。 也 就 是 说 ， 我 们 现在 介绍 的 知识 全 都 来 自 于 近 60 年 
前 这 位 伟大 科学 家 的 研究 成 果 ， 而 我 们 平时 所 用 的 压缩 和 解压 缩 技术 也 
都 是 基于 赫 夫 曼 的 研究 之 上 发 展 而 来 ， 我 们 应 该 要 记 住 他 。 








TAY RA PTE? 我 们 先 来 看 一 个 例子 。 





过 去 我 们 小 学 、 中 学 一 般 考 试 都 是 用 百分制 来 表示 学 科 成 绩 的 。 这 带 来 
了 一 个 浆 端 ， 就 是 很 容易 让 学 生 、 家 长 ， 甚 至 老师 目 己 都 以 分 取 人 ， 让 
分 数 代 表 了 一 切 。 有 时 想 想 也 对 ，90 分 和 95 分 也 许 就 只 是 一 道 题目 对 错 
的 兰 距 ， 但 却 让 两 个 孩子 可 能 受到 完全 不 同 的 街 遇 ， 这 并 不 公平 。 于 是 
在 如 今 提 倡 系 质 教 育 的 背景 下 ， 我 们 很 多 的 学 科 ， 特 别 是 小 学 的 学 科 成 
绩 都 改作 了 优秀 、 民 好 、 中 等 、 及 格 和 不 及 格 这 样 模糊 的 词语 ， 不 再 通 
报 具 体 的 分 数 。 

















不 过 对 于 老师 来 讲 ， 他 在 对 试卷 评分 的 时 候 ， 显 然 不 能 和 赁 感觉 给 优 民 或 
及 格 不 及 格 等 成 绩 ， 因 此 一 般 都 还 是 按照 百分制 算出 每 个 学 生 的 成 绩 
后 ， 再 根据 统一 的 标准 换算 得 出 五 级 分 制 的 成 绩 。 比 如 下 面 的 代码 就 实 
现 了 这 样 的 转换 。 


if (a < 60) 

b = "不 及 格 " 

else if (a < 70) 
1 

else if (a < 80) 
b z" HG 

else if (a < 90) 
b = W es 


else 





b 二 iu as": 





图 6-12-2 粗 略 看 没什么 问题 ， 可 是 通常 都 认为 ， 一 张 好 的 考卷 应 该 是 让 
学 生成 绩 大 部 分 处 于 中 等 或 民 好 的 范围 ， 优 秀和 不 及 格 都 应 该 较 少 才 
对 。 而 上 面 这 样 的 程序 ， 惑 使 得 所 有 的 成 绩 都 需要 先 判断 是 否 及 格 ， 再 
逐 级 而 上 得 到 结果 。 输 入 量 很 大 的 时 候 ， 其 实 算法 是 有 效率 问题 的 。 











图 6-12-2 


S a MR ter ocean 
12-1 所 示 。 
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表 6-12-1 


那么 70 分 以 上 大 约 占 总 数 80% 的 成 绩 都 需要 经 过 3 次 以 上 的 判断 才 可 以 
得 到 结果 ， 这 显然 不 合理 。 





有 没有 好 一 些 的 办 法 ， 仔 细 观 察 发 现 ， 中 等 成 绩 《〈70 一 79 分 之 间 ) 比例 
最 高 ， 其 次 是 民 好 成 绩 ， 不 及 格 的 所 占 比 例 最 少 。 我 们 把 图 6-12-2 这 檬 
二 广 树 重新 进行 分 配 。 改 成 如 图 6-12-3 的 做 法 试 试看 。 
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图 6-12-3 





从 图 中 感觉 ， 应 该 效率 要 高 一 些 了 ， 到 底 高 多 少 昵 。 这 样 的 二 又 树 又 是 
如 何 设计 出 来 的 呢 ? ATR KSA ce BO AT eI 





6.12.2 HREM EMS 


FRAN FETE IK PSR SON Tl HG BO PB PAY SO ( 注 : 树 结 点 间 的 
边 相 关 的 数 叫做 权 Weight) , 如 図 6-12-4 所 示 。 其 中 A 表 示 不 及 格 、B 表 
示 及 格 、C 表 示 中 等 、D 表 示 良 好 、E 表 示 优 秀 。 每 个 叶子 的 分 支线 上 的 
数字 就 是 刚才 我 们 提 到 的 五 级 分 制 的 成 绩 所 占 百 分 比 。 





Uha -Hb 
图 6-12-4 


赫 夫 曼 大 叔 说 ， 从 树 中 一 个 结 点 到 另 一 个 结 点 之 间 的 分 文 构成 两 个 结 氮 
之 间 的 路 径 ， 路 径 上 的 分 文 数目 称 做 路 径 长 度 。 图 6-12-4 的 二 叉 树 a 中 ， 
根 结 点 到 结 点 D 的 路 径 长 度 跳 为 4， 二 又 树 b 中 根 结 点 到 结 点 D 的 路 径 长 
度 为 2。 树 的 路 径 长 度 就 是 从 树 根 到 每 一 结 点 的 路 径 长 度 之 和 。 二 又 树 a 
的 树 路 径 长 度 融 为 1+1+2+2+3+3+4+4=20。 二 又 树 b 的 树 路 径 长 度 束 为 





1+2+3+3+2+1+2+2=16。 


如 果 考 虑 到 带 权 的 结 点 ， 结 反 的 带 权 的 路 径 长 度 为 从 该 结 点 到 树 根 之 间 
的 路 径 长 度 与 结 皮 上 权 的 乘积 。 树 的 市 权 路 径 长 度 为 树 中 所 有 叶子 结 反 
的 之 权 路 人 径 长 度 之 和 。 假 设 有 n 个 权 值 {wi,w,…,wn}， 构 造 一 柠 有 n 个 叶 
子 结 点 的 二 叉 树 ， 每 个 叶子 结 点 带 权 wk， 每 个 叶子 的 路 径 长 度 为 lt， 我 
们 通常 记 作 ， 则 其 中 带 权 路 径 长 度 WPL 最 小 的 二 叉 树 称 做 赫 夫 曼 树 。 也 
有 不 少 书 中 也 称 为 最 优 二 又 树 ， 我 个 人 觉得 为 了 纪念 做 出 巨大 页 献 的 科 
学 家 ， 既 然 用 他 们 的 名 字 命名 ， 就 应 该 要 坚持 用 他 们 的 名 字 称呼 ， 哪 
怕 “ 最 优 ?更 能 体现 这 标 树 的 品质 也 应 该 只 作为 别名 。 











有 了 赫 夫 曼 对 带 权 路 径 长 度 的 定义 ， 我 们 来 计算 一 下 图 6-12-4 这 两 棵 树 
的 WPL 值 。 


二 叉 树 a 的 WPL=5x1+15x2+40x3+30x4+10x4=315 


注意 : 这 里 5 是 A 结 点 的 权 ，1 是 A 结 点 的 路 径 长 度 ， 其 他 同 理 。 


二 叉 树 b 的 WPL=5x3+15x3+40x2+30x2+10x2=220 


这 样 的 结果 意味 着 什么 呢 ? 如果 我 休 現在 有 10000 條 学生 的 百 分 制 成 希 
需要 计算 五 级 分 制 成 绩 ， 用 二 又 树 a 的 判断 方法 ， 需 要 做 31500 次 比较 ， 
而 二 又 树 b 的 判断 方法 ， 只 需要 22000 次 比较 ， 差 不 多 少 了 三 分 之 一 量 ， 
在 性 能 上 提高 不 是 一 点 点 。 








那么 现在 的 问题 就 是 ， 图 6-12-4 的 二 又 树 b 这 样 的 树 是 如 何 构造 出 来 的 ， 
这 样 的 二 又 树 是 不 是 就 是 最 优 的 赫 夫 曼 树 昵 ? 別 急 , PRE KMS TR 
们 解决 的 办 法 。 














1. 先 把 有 权 值 的 叶子 结 皮 按照 从 小 到 大 的 顺序 排列 成 一 个 有 序 序列 ， 
BJ: AS, E10, B15, D30, C40. 


2. ERSkPa Mae) SUE 2a TEA TBA ASP 2 a 注意 相 
对 较 小 的 是 左 孩 子 ， 这 里 就 是 A 为 Ni 的 左 孩子 ，E 为 Ni 的 右 孩 子 ， 如 图 
6-12-5 所 示 。 新 结 反 的 权 值 为 两 个 叶子 权 值 的 和 5+10=15。 


图 6-12-5 


3. 将 Ni 丛 换 A 与 E， 插 入 有 序 序列 中 ， 保 持 从 小 到 大 排列 。 即 : N115, 
B15，D30，C40。 


4. 重复 步骤 2。 将 Ni 与 B 作 为 一 个 新 节点 N? 的 两 个 子 结 点 。 如 图 6-12-6 
所 示 。N, 的 权 值 =15+15=30。 


图 6-12-6 


5. 将 N> 丛 换 Ni 与 B， 插 入 有 序 序列 中 ， 保 持 从 小 到 大 排列 。 即 : 


N。30, D30, C40。 


6. 重复 步骤 2。 将 N> 与 D 作 为 一 个 新 节点 N3 的 两 个 子 结 点 。 如 图 6-12-7 
所 示 。N; 的 权 值 =30+30=60。 


S © 
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图 6-12-7 


7. 将 Na 蔡 换 Nz 与 D， 插 入 有 序 序列 中 ， 保 持 从 小 到 大 排列 。 即 : C40, 
N。60。 


8. HR R2. HCSN AEN PoP THATS Pea, 如 図 6-12-8 所 
示 。 由 于 T 即 是 根 结 点 ， 完 成 赫 夫 曼 树 的 构造 。 








图 6-12-8 


此 时 的 图 6-12-8 二 又 树 的 带 权 路 径 长 度 
WPL=40x1+30x2+15x3+10x4+5x4=205。 与 图 6-12-4 的 二 叉 树 b 的 WPL 值 
TO 
对 。 


不 过 现实 总 是 比 理想 要 复杂 得 多 ， 图 6-12-8 虽 然 是 赫 夫 曼 树 ， 但 由 于 每 
次 判断 都 要 两 次 比较 (如 根 结 点 就 是 a<80&&a>=70， 两 次 比较 才能 得 到 
y 或 n 的 结果 ) ， 所 以 总 体 性 能 上 ， 反 而 不 如 图 6-12-3 的 二 又 树 性 能 高 。 
当然 这 并 不 是 我 们 要 讨论 的 重点 了 。 


通过 刚才 的 步骤 ， 我 们 可 以 得 出 构造 灰 夫 曼 树 的 炙 夫 曼 算 法 描述 。 


1. 根 据 给 定 的 n 个 权 值 {wtw>…wa} 构 成 n 棵 二 又 树 的 集合 F= 
{T12T2…Tnj， 其 中 每 棵 二 又 树 Ti 中 只 有 一 个 带 权 为 wi 根 结 点 ， 其 左右 子 
树 均 为 空 。 


2. 在 F 中 选取 两 棵 根 结 点 的 权 值 最 小 的 树 作为 左右 子 树 构 造 一 柠 新 的 二 
ER E 
IP 

3. 在 F 中 删除 这 两 棵 树 ， 同 时 将 新 得 到 的 二 又 树 加 入 F 中 。 

4. 午 复 2 和 3 步骤 ， 和 直到 F 只 含 一 标 树 为 止 。 这 标 树 便 是 赫 夫 曼 树 。 





6.12.3 ER = inti 





当然 , PRAHA RR A AEA T RITE ARE FB RH 
他 的 更 大 目的 是 为 了 解决 当年 远 距离 通信 (主要 是 电报 ) 的 数据 传输 的 
最 优化 问题 。 





比如 我 们 有 一 段 文 字 内 容 为 “BADCADFEED” 要 网 络 传输 给 别人 ， 显 然 
用 二 进 制 的 数字 (0 和 1)》 来 表示 是 很 自然 的 想法 。 我 们 现在 这 段 文字 只 
有 六 个 字母 ABCDEF， 那 么 我 们 可 以 用 相应 的 二 进 制 数据 表示 ， 如 表 6- 








12-2 所 示 。 


pe fA Be EF 





EA 


表 6-12-2 


这 样 真 正 传输 的 数据 就 是 编码 后 

的 “001000011010000011101100100011”， 对 方 接收 时 可 以 按照 3 位 一 分 
来 译 码 。 如 果 一 篇 文章 很 长 ， 这 样 的 二 进 制 串 也 将 非常 的 可 怕 。 而 且 事 
实 上 ， 不 管 是 英文 、 中 文 或 是 其 他 语言 ， 字 母 或 汉字 的 出 现 频率 是 不 相 
同 的 ， 比 如 英语 中 的 几 个 元 音字 母 “ae i o u?, 中 文中 的 “的 了 有 在 ”等 
汉字 都 是 频率 极 高 。 











假设 六 个 字母 的 频率 为 A 27, B 8, C 15，D15，E 30，F 5， 合 起 来 正好 
是 100%。 那 就 意味 着 ， 我 们 完全 可 以 重新 按照 芋 夫 曼 树 来 规划 它们 。 


图 6-12-9 左 图 为 构造 赫 夫 曼 树 的 过 程 的 权 值 显示 。 石 图 为 将 权 值 左 分 文 
改 为 0， 石 分 文 改 为 1 后 的 赫 夫 曼 树 。 





图 6-12-9 





此 时 ， 我 们 对 这 六 个 字母 用 其 从 树 根 到 叶子 所 经 过 路 径 的 0 或 1 来 编码 ， 
可 以 得 到 如 表 6-12-3 所 示 这 样 的 定义 。 


| 





E AA 


表 6-12-3 





我 们 将 文字 内 容 为 "BADCADFEED” 再 次 编码 ， 对 比 可 以 看 到 结果 串 变 
小 了 。 


。 原 编码 二 进 制 串 : 001000011010000011101100100011 ( 共 30 企 字 
符 ) 
e 新 编码 二 进 制 串 : 1001010010101001000111100( 共 25 个 字符 ) 


也 束 是 说 ， 我 们 的 数据 被 压缩 了 ， 市 约 了 大 约 17% 的 存储 或 传输 成 本 。 
随 痢 字符 的 增加 和 多 字符 权重 的 不 同 ， 这 种 压缩 会 更 加 显 出 其 优势 。 


当 我 们 接收 到 1001010010101001000111100 这 样 压缩 过 的 新 编码 时 ， 我 
们 应 该 如 何 把 它 解 码 出 来 呢 ? 





编码 中 非 0 即 1， 长 短 不 等 的 话 其 实 是 很 容易 混淆 的 ， 所 以 大 要 设计 长 短 
不 等 的 编码 ， 则 必须 是 任 一 字符 的 编码 都 不 是 另 一 个 字符 的 编码 的 前 
缀 ， 这 种 编码 称 做 前 绥 编 码 。 








你 仔细 观察 就 会 发 现 ， 表 6-12-3 中 的 编码 就 不 存在 容易 与 1001、1000 混 
y 的 “10” 利 “1007245 上 


可 仅仅 是 这 样 不 足以 让 我 们 去 方便 地 解码 的 ， 因 此 在 解码 时 ， 还 是 要 用 
到 赫 夫 曼 树 ， 即 发 送 方 和 接收 方 必须 要 约定 好 同样 的 赫 夫 曼 编 码 规则 。 











当 我 们 接收 到 1001010010101001000111100 时 ， 由 约定 好 的 赫 夫 曼 树 可 
知 ，1001 得 到 第 一 个 字母 是 B， 接 下 来 01 意 味 着 第 二 个 字符 是 A， 如 图 
6-12-10 所 示 ， 甚 余 的 也 相应 的 可 以 得 到 ， 从 而 成 功 解码 。 
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图 6-12-10 
一 般 地 ， 设 需要 编码 的 字符 集 为 {dj,d ,dj}， 各 个 字符 在 电文 中 出 现 的 
次 数 或 频率 集合 为 {wjwz ww }， 以 dj,d.,d 作为 叶子 结 点 ， 以 





wbw2wn 作 为 相应 叶子 结 点 的 权 值 来 构造 一 株 赫 夫 受 树 。 规 定 赫 夫 曼 
树 的 左 分 文 代表 0， 右 分 文 代表 1， 则 从 根 结 点 到 叶子 结 点 所 经 过 的 路 径 
分 支 组 成 的 0 和 1 的 序列 便 为 该 结 点 对 应 字符 的 编码 ， 这 就 是 赫 夫 曼 编 
码 。 








6.13 ”总 结 回 顾 


终于 到 了 总 结 的 时 间 ， 这 一 章 与 前 面 章 节 相 比 ， 显 得 过 于 庞大 了 些 ， 原 
因 也 就 在 于 树 的 复杂 性 和 变化 丰富 上 度 是 前 面 的 线性 表 所 不 可 比拟 的 。 即 
E 
A Eza E 


开头 我 们 提 到 了 树 的 定义 ， 讲 到 了 递归 在 树 定 义 中 的 应 用 。 提 到 了 如 子 
树 、 结 点 、 度 、 叶 子 、 分 支 结 点 、 双 亲 、 孩 子 、 层 次、 深度 、 和 森林 每 诸 
多 概念 ， 这 些 都 是 需要 在 理解 的 基础 上 去 记忆 的 。 








我 们 谈 到 了 树 的 存储 结构 时 ， 讲 了 双亲 表示 法 、 孩 子 表示 法 、 孩 子 兄 第 
表示 法 等 不 同 的 存储 结构 。 





并 由 孩子 兄 第 表示 法 引出 了 我 们 这 革 中 最 重要 一 种 树 ， 二 又 树 。 





二 义 树 每 个 结 点 最 多 两 棵 子 树 ， 有 左右 之 分 。 提 到 了 和 斜 树 ， 满 二 又 树 、 
完全 二 又 树 等 特殊 二 又 树 的 概念 。 


我 们 接着 谈 到 它 的 各 种 性 质 ， 这 些 性 质 给 我 们 研究 二 又 树 带 来 了 方便 。 


二 又 树 的 存储 结构 由 于 其 特殊 性 使 得 既 可 以 用 顺序 存储 结构 又 可 以 用 链 
式 存 储 结构 表示 。 





避 历 是 二 叉 树 最 重要 的 一 门 学 问 ， 前 序 、 中 序 、 后 序 以 及 层 序 吉 历 痢 是 
需要 测 练 掌握 的 知识 。 要 让 自己 要 学 会 用 计算 机 的 运行 思维 去 模拟 递归 
的 实现 ， 可 以 加 深 我 们 对 递归 的 理解 。 不 过 ， 并 非 二 又 树 遍 历史 一 定 要 
用 到 递归 ， 只 不 过 递归 的 实现 比较 优雅 而 已 。 这 点 需要 明确 。 





二 又 树 的 建立 上 自然 也 是 可 以 通过 递归 来 实现 。 











研究 中 也 发 现 ， 二 了 叉 链 表 有 很 多 浪费 的 空 指 针 可 以 利用 ， 查 找 共 个 结 点 
的 前 驱 和 后 继 为 什么 非 要 每 次 志 历 才 可 以 得 到 ， 这 束 引 出 了 如 何 构造 一 
IO 
AK 








树 、 和 森林 看 似 复 杂 ， 其 实 它 们 都 可 以 转化 为 简单 的 二 又 树 来 处 理 ， 我 们 
提供 了 树 、 和 森林 与 二 又 树 的 互相 转换 的 办 法 ， 这 样 束 使 得 面 对 树 和 和 森林 
的 数据 结构 时 ， 编 码 实现 成 为 了 可 能 。 








最 后 ， 我 们 提 到 了 关于 二 又 树 的 一 个 应 用 ， 炙 夫 曼 树 和 赫 夫 曼 编 码 ， 对 
于 带 权 路 径 的 二 又 树 做 了 详尽 地 讲述 ， 证 你 初步 理解 数据 压缩 的 原理 ， 
并 明日 其 是 如 何 做 到 无 损 编码 和 无 错 解码 的 。 


6.14 结尾 语 


在 我 们 这 章 开 头 ， 我 们 提 到 了 《 阿 凡 达 》 这 部 电影 ， 电 影 中 有 一 个 情节 
就 是 人 类 用 先进 的 航空 武器 和 导弹 人 硬是 将 那 柠 纳 威 人 赖 以 生存 的 苑 天 大 
树 给 放 倒 了 ， 让 人 很 是 哇 咕 感慨 ， 如 图 6-14-1 所 示 。 这 尽管 讲 的 只 是 一 
个 虚构 的 故事 ， 但 在 现实 社会 中 ， 人 类 为 了 茶 种 很 短期 的 利益 ， 乱 砍 滥 
伐 ， 毁 灭 和 森林 ， 破 坏 植被 几 乎 天 天 都 在 我 们 居住 的 地 球 上 演 。 








图 6-14-1 








这 样 造 成 的 结果 惑 是 冬天 深 寨 、 夏 天 酷热 、 超 强 台风 、 百 年 洪水 、 滚 滚 
泥 流 、 无 尽 干 旱 。 我 们 地 球 上 人 类 的 生存 环境 发 发 可 人 危 。 











树 。 但 在 这 





征 的 ， 这 只 是 一 音 计 算 机 读 ， 讲 的 是 无 生命 的 数据 结构 
一 章 的 最 后 ， 我 还 是 想 呼 吁 一 下 大 家 。 


人 受伤 时 还 会 流下 泪水 ， 树 受伤 时 ， 老 天 都 不 会 活 注 。 和 希望 我 们 的 未 来 
不 要 仪 仪 有 钢筋 水 泥 建 造 的 高 楼 和 大 厦 ， 也 要 有 郁郁 欧 获 的 森林 和 草 
地 ， 我 们 人 类 才 可 能 与 自然 和 谐 共 处 。 爱 护 树 木 、 保 护 森 林 ， 让 我 们 为 
生存 的 家 园 能 够 更 加 上 自然 与 美好 ， 尽 一 份 目 己 的 力量 。 





好 了 , SRAMA, FR 





AY: 

图 (Graph) 是 由 顶点 的 有 穷 非 空 集合 和 顶点 之 间 边 的 集合 组 成 ， 通 常 
表示 为 : G(V,E)， 其 中 ，G 表 示 一 个 图 ，V 是 图 G 中 顶点 的 集合 ，E 是 图 
G 中 边 的 集合 。 


7.1 开场 白 





旅游 几乎 是 每 个 年 轻 人 的 爱好 ， 但 没有 钱 或 没 时 间 也 是 困惑 年 轻 人 不 能 
圆梦 的 直接 原因 。 如 果 可 以 用 最 少 的 资金 和 最 少 的 时 间 周 游 中 国 甚至 是 
世界 一 定 是 非常 棒 的 。 假 设 你 已 经 有 了 一 笔 不 算 很 丰裕 的 用 钱 ， 也 有 了 
约 半年 的 时 间 。 此 时 打算 全 国 性 的 旅游 ， 你 将 会 如 何 安排 这 次 行程 呢 ? 








我 们 假设 旅游 残 是 逐个 省 市 进行 ， 省 市 内 的 风景 区 不 去 细 分 ， 例 如 北大 
玩 7 天 ， 天 津 款 3 天 ， 四 川 玩 20 天 这 样子 。 你 现在 需要 做 的 就 是 制订 一 个 
规划 方案 ， 如 何 才能 用 最 少 的 成 本 将 图 7-1-1 中 的 所 有 省 市 都 玩 届 ， 这 里 
所 谓 最 少 的 成 本 是 指 交 通 成 本 与 时 间 成 本 。 











如 果 你 不 善于 规划 ， 很 有 可 能 就 会 出 现 如 玩 好 新 疆 后 到 海南 ， 然 后 再 冲 
加 黑龙 江 这 样 的 殉 唐 决策 。 但 是 即使 是 基 挨 看 省 市 游玩 的 方案 也 会 存在 
很 复杂 的 选择 问题 ， 比 如 洲 完 湖北 ， 周 边 有 安徽 、 江 西 、 调 南 、 重 庆 、 
陕西 、 河 南 等 省 市 ， 你 下 一 步 怎么 走 最 划算 呢 ? 











你 一 时 解答 不 了 这 些 问 题 是 很 正常 的 ， 计 算 的 工作 本 来 就 非 人 脑 而 应 该 
是 电脑 去 做 的 事情 。 我 们 今天 要 开始 学 习 最 有 意思 的 一 种 数据 结构 
图 。 在 图 的 应 用 中 ， 束 有 相应 的 算法 来 解决 这 样 的 问题 。 学 完 这 一 章 ， 
即便 不 能 马上 获得 最 终 的 答案 ， 你 也 大 概 知道 应 该 如 何 去 做 了 。 








7.2 图 的 定妆 





在 线性 表 中 ， 数 据 元 素 之 间 是 被 串 起 来 的 ， 仅 有 线性 关系， 每 个 数据 元 
素 只 有 一 个 直接 前 驱 和 一 个 直接 后 继 。 在 树 形 结构 中 ， 数 据 元 素 之 间 有 
者 明显 的 层次 关系 ， 并 且 每 一 层 上 的 数据 元 素 可 能 和 下 一 层 中 多 个 元 勾 
相关 ， 但 只 能 和 上 一 层 中 一 个 元 素 相关 。 这 和 一 对 父母 可 以 有 多 个 孩 

子 ， 但 每 个 孩子 却 只 能 有 一 对 父母 是 一 个 道理 。 可 现实 中 ， 人 与 人 之 间 
关系 束 非 第 复杂 ， 比 如 我 认识 的 朋友 ， 可 能 他 们 之 间 也 互相 认识 ， 这 区 
不 是 简单 的 一 对 一 、 一 对 多 ， 研 究 人 际 关 系 很 自然 会 考虑 多 对 多 的 情 

况 。 那 就 是 我 们 今天 要 研究 的 主题 一 一 图 。 图 是 一 种 较 线性 表 和 树 更 加 
复杂 的 数据 结构 。 在 图 形 结构 中 ， 结 点 之 间 的 关系 可 以 是 任意 的 ， 图 中 
任意 两 个 数据 元 系 之 间 都 可 能 相关 。 























前 面 同学 可 能 觉得 树 的 术语 好 多 ， 可 来 到 了 图 ， 你 就 知道 ， 什 么 才 叫 做 
真正 的 术语 多 。 不 过 术语 再 多 也 是 有 规律 可 授 的 ， 让 我 们 开始 “图 ”世界 
的 旅程 。 如 图 7-2-1 所 示 ， 先 来 看 定义 。 


图 7-2-1 








图 (Graph) 是 由 顶点 的 有 穷 非 空 集 合 和 顶点 之 间 边 的 集合 组 成 ， 通 常 
表示 为 : G(V,E)， 其 中 ，G 表 示 一 个 图 ，V 是 图 G 中 顶点 的 集合 ，E 是 图 
G 中 边 的 集合 。 


对 于 图 的 定义 ， 我 们 需要 明确 几 个 注意 的 地 方 。 





。 线性 表 中 我 们 把 数据 元 素 叫 元 素 ， 树 中 将 数据 元 系 叫 结 点 ， 在 图 中 
数据 元 素 ， 我 们 则 称 之 为 项 点 (Vertex) 。 
。 线性 表 中 可 以 没有 数据 元 素 ， 称 为 空 表 。 树 中 可 以 没有 结 点 ， 叫 做 
空 树 。 那 么 对 于 图 呢 ? 我 记得 有 一 个 笑话 说 一 个 小 朋友 拿 着 一 张 空 
和 白 纸 给 别人 却说 这 是 他 画 的 一 幅 “ 牛 吃 草 ”的 画 , “ 那 草 呢 ? et Be 
ET o RPE? “API SE ie SUF. CAO RAN 
我 们 根本 不 认为 一 张 空 白 纸 算 作 画 的 。 同 样 ， 在 图 结构 中 ， 不 允许 
o 在 定义 中 ， 知 V 是 顶点 的 集合 ， 则 强调 了 顶点 集合 V 有 
FARRS 
线性 表 中 ， 相 邻 的 数据 元 系 之 间 具 有 线性 关系 ， 树 结构 中 ， 相 邻 两 
层 的 结 点 具有 层次 关系 ， 而 图 中 ， 任 意 两 个 顶点 之 间 都 可 能 有 关 
系 ， 顶 点 之 间 的 逻辑 关系 用 边 来 表示 ， 边 集 可 以 是 空 的 。 


7.2.1 各 种 图 定义 




















E: 在 顶点 Vi 到 Vj 之 间 的 边 疫 有 方向 ， 则 称 这 条 边 为 无 问 边 

(Edge) ， 用 无 厅 侦 对 (vi,vj) 来 表示 。 如 果 图 中 任意 两 个 项 点 之 间 的 边 
都 是 无 回 边 ， 则 称 该 图 为 无 同 图 (Undirected graphs)。 图 7-2-2 束 是 一 
个 无 向 图 ， 由 于 是 无 方向 的 ， 连 接 顶 点 A 与 D 的 边 ， 可 以 表示 成 无 序 对 
(A,D)， 也 可 以 写成 (D,A)。 





对 于 图 7-2-2 中 的 无 向 图 G1 来 说 ，G1=(Vj,{E1})， 其 中 顶点 集合 Vj= 
{A,B,C,D}; 边 集 合 E1={(A,B),(B,C),(C,D),(D,A),(A,C)} 


图 7-2-2 


Al: 硝 从 顶 反 Vi 到 vj 的 边 有 方 辐 ， 则 称 这 条 边 为 有 问 边 ， 也 称 为 弧 
(Arc) 。 用 有 序 偶 <vivi> 来 表示 ，Vi 称 为 踊 尾 〈Tail) ，Vj 称 为 弧 头 
(Head) 。 如 有 果 图 中 任意 两 个 顶点 之 间 的 边 都 是 有 问 边 ， 则 称 该 图 为 有 
向 較 (Directed graphs)。 图 7-2-3 束 是 一 个 有 问 图 。 连 接 顶 点 A 到 D 的 有 
辣 边 就 是 浙 ，A 是 弧 尾 ，D 是 弧 涉 ，<A,D> 表 示 缴 ， 注 意 不 能 写成 
<D,A>。 


图 7-2-3 


¢FA7-2-37 WH RAG Kb, G。=(V。,(E。)), 其 中 頂点 集合 V。= 
{A,B,C,D}; JMS4E,={<A,D>,<B,A>,<C,A>,<B,C>}. 


看 清楚 了 ， 无 癌 边 用 小 括号 “0 表示 ， 而 有 问 边 则 是 用 尖 括 号 “<>” 表 


ZN o 





在 图 中 ， 硅 不 存在 顶点 到 其 自 届 的 边 ， 且 同一 条 边 不 重复 出 现 ， 则 称 这 
样 的 图 为 简单 图 。 我 们 诬 程 里 要 讨论 的 都 是 简单 图 。 显 然 图 7-2-4 中 的 两 
个 图 就 不 属于 我 们 要 讨论 的 范围 。 


图 7-2-4 


在 无 向 图 中 ， 如 果 任 意 两 个 顶点 之 间 都 存在 边 ， 则 称 该 图 为 无 向 完全 
图 。 含 有 n 个 顶点 的 无 向 完全 图 有 n(n-1)/2 条 边 。 比 如 图 7-2-5 就 是 无 向 完 
全 图 ， 因 为 每 个 顶点 都 要 与 除 它 以 外 的 顶点 连 线 ， 顶 点 A 与 BCD 三 个 顶 


点 连 线 ， 共 有 四 个 顶点 ， 自 然 是 4x3， 但 由 于 顶点 A 与 顶点 B 连 线 后 ， 计 
算 B 与 A 连 线 就 是 重复 ， 因 此 要 整体 除 以 2， 共 有 6 条 边 。 


AK 


WY 


在 有 疝 图 中 ， 如 果 任 意 两 个 顶点 之 间 都 存在 方向 互 为 相反 的 两 条 弧 ， 则 
称 该 图 为 有 向 完 全 图 。 含 有 n 个 顶点 的 有 问 完 全 图 有 nx(n-1) 条 边 ， 如 图 








图 7-2-5 








7-2-6 所 示 。 


图 7-2-6 


从 这 里 也 可 以 得 到 结论 ， 对 于 具有 n 个 顶点 和 e 条 边 数 的 图 ， 无 向 图 
0<e<n(n-1)/2， 有 问 图 0<e<n(n-1)。 


AR FIZ MI PK Ar, ZORA AE Rik A A ze 
模糊 的 概念 ， 部 是 相对 而 言 的 。 比 如 我 去 上 海 世博 会 那天 ， 参 观 的 人 数 
差不多 50 万 人 ， 我 个 人 感觉 人 数 实在 是 太 多 ， 可 以 用 稠密 来 形容 。 可 后 
A eee ner eee re nen Wed ence 
: fe Bi o 














有 些 图 的 边 或 弧 具 有 与 它 相 关 的 数字 ， 这 种 与 图 的 边 或 弧 相关 的 数 叫 做 
权 (Weight) 。 这 些 权 可 以 表示 从 一 个 顶点 到 男 一 个 顶点 的 距离 或 耗 
费 。 这 种 带 权 的 图 通常 称 为 网 (Network) 。 图 7-2-7 就 是 一 张 带 权 的 
图 ， 即 标识 中 国 四 大 城市 的 直线 距离 的 网 ， 此 图 中 的 权 就 是 两 地 的 距 
A o 








图 7-2-7 


假设 有 两 个 图 G=(V,{E}) 和 G'=(V',{E'})， 如 果 V'V 有 EE， 则 称 G' 为 G 的 子 
上 ae 。 例 如 图 7-2-8 带 底 纹 的 图 均 为 左 侧 无 回 图 与 有 癌 图 的 








図 7-2-8 


7.2.2 图 的 顶点 与 边 间 关系 


对 于 无 问 图 G=(V,{E})， 如 果 边 (Vv,v)eEE， 则 称 顶点 v 和 vV' 互 为 邻接 点 
(Adjacent) , 即 v 和 v 相 爺 接 。 辺 (vV,v り 依 附 〈incident) 于 顶点 v 和 w， 
或 者 说 (Vv,V) 与 项 点 v 和 v' 相 关联 。 顶 点 Vv 的 上 度 (Degree) 是 和 v 相 关联 的 边 
的 数目 ， 记 为 TD(v)。 例 如 图 7-2-8 左 侧 上 方 的 无 加 图 ， 顶 点 A 与 B 互 为 邻 
接点 ， 边 (A,B) 依 附 于 顶点 A 与 B 上 ， 顶 点 A 的 度 为 3。 而 此 图 的 边 数 是 
5， 各 个 顶点 度 的 和 =3+2+3+2=10， 推 谣 后 发 现 ， 边 数 其 实 就 是 各 顶点 
度数 和 的 一 半 ， 多 出 的 一 半 是 因为 重复 两 次 记 数 。 简 记 之 ，。 





对 于 有 向 图 G=(V,{E})， 如 果 弧 <v,v>EE， 则 称 顶点 v 邻 接 到 顶点 v'"， 顶 
点 V' 邻 接 自 顶点 v。 弧 <v,v> 和 顶点 v，v' 相 关联 。 以 顶点 v 为 涉 的 弧 的 数 
目 称 为 v 的 入 度 (InDegree)， 记 为 ID(V);， 以 v 为 尾 的 弧 的 数目 称 为 v 的 
出 度 (OutDegree〉， 记 为 OD(v)， 顶 点 Vv 的 度 为 TD(v)=ID(V)+OD(Vv)。 例 
如 图 7-2-8 左 侧 下 方 的 有 向 图 ， 顶 点 A 的 入 度 是 2( 从 B 到 A 的 弧 ， 从 C 到 A 
的 弧 〉， 出 度 是 1( 从 A 到 D 的 弧 〉， 所 以 顶点 A 的 度 为 2+1=3。 此 有 向 
图 的 弧 有 4 条 ， 而 各 顶点 的 出 度 和 =1+2+1+0=4， 各 顶点 的 入 度 和 
=2+0+1+1=4。 所 以 得 色 e=sigma(i=1, n, ID(v;=sigma(i=1, n, OD(v;). 





Ee AIG=(V {E) FMLA VET eee (Path) 是 一 个 顶点 序列 
(v=v;,0,v;,1,...v,m=v'), HP (v j-1,v j) EE, 1<j<m。 例 如 疾 7-2-9 中 就 列 
举 了 顶点 B 到 顶点 D 四 种 不 同 的 路 径 。 


AAD: 


“TEND 


图 7-2-9 





如 果 G 是 有 向 图 ， 则 路 径 也 是 有 向 的 ， 顶 点 序列 应 满足 <vi,j-1,v;,j> EE, 
ae 例如 图 7-2-10， 顶 点 B 到 D 有 两 种 路 径 。 而 顶点 A 到 B， 就 不 存在 
路 径 。 


图 7-2-10 


树 中 根 结 点 到 任意 结 皮 的 路 径 是 唯一 的 ， 但 古 图 中 顶点 与 项 反之 间 的 路 
径 却 是 不 唯一 的 。 





路 径 的 长 度 是 路 径 上 的 边 或 弧 的 数目 。 图 7-2-9 中 的 上 方 两 条 路 径 长 度 为 
2， 下 方 两 条 路 径 长 度 为 ?3。 图 7-2-10 左 侧 路 径 长 为 2， 右 侧 路 径 长 度 为 





第 一 个 顶点 和 最 后 一 个 顶点 相同 的 路 径 称 为 回路 或 环 〈Cycle) 。 序 列 
中 顶点 不 重复 出 现 的 路 径 称 为 简单 路 径 。 除 了 第 一 个 顶点 和 最 后 一 个 顶 
点 之 外 ， 其 余 顶 点 不 重复 出 现 的 回路 ， 称 为 简单 回路 或 简单 环 。 图 7-2- 
11 中 两 个 图 的 粗 线 都 构成 环 ， 左 侧 的 环 因 第 一 个 顶点 和 最 后 一 个 顶点 都 
是 B， 且 C、D、A 没 有 重复 出 现 ， 因 此 是 一 个 简单 环 。 而 右 侧 的 环 ， 由 
于 顶点 C 的 重复 ， 它 就 不 是 简单 环 了 。 














图 7-2-11 


7.2.3 ”连通 图 相关 术语 


在 无 问 图 G 中 ， 如 果 从 顶点 v 到 顶点 有 路 径 ， 则 称 v 和 V 是 连通 的 。 如 果 
对 于 图 中 任意 两 个 顶点 vi、v;eV，vi 和 vi 都 是 连通 的 ， 则 称 G 是 连通 图 
(Connected Graph) 。 图 7-2-12 的 图 1， 它 的 顶点 A 到 顶点 B、C、D 都 是 
连通 的 ， 但 显然 项 点 A 与 顶点 E 或 F 就 无 路 径 ， 因 此 不 能 算是 连通 图 。 而 
图 7-2-12 的 图 2， 顶 点 A、B、C、D 相 互 都 是 连通 的 ， 所 以 它 本 喘 是 连通 
Al. 
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无 向 图 中 的 极 大 连通 子 图 称 为 连通 分 量 。 注 意 连 通 分 量 的 概念 ， 它 强 
iA: 





。 要 是 子 图 ; 

。 子 图 要 是 连通 的 ; 

。 连通 子 图 含有 极 大 顶点 数 ; 

。 具有 极 大 顶点 数 的 连通 子 图 包含 依附 于 这 些 顶 点 的 所 有 边 。 


图 7-2-12 的 图 1 是 一 个 无 回 非 连 通 图 。 但 是 它 有 两 个 连通 分 量 ， 即 图 2 和 
图 3。 而 图 4， 尽 管 是 图 1 的 子 图 ， 但 是 它 却 不 满足 连通 子 图 的 极 大 项 点 
数 〈 图 2 满足 ) 。 因 此 它 不 是 图 1 的 无 向 图 的 连通 分 量 。 











在 有 向 图 G 中 ， 如 果 对 于 每 一 对 vi、ViEV、vizvj， 从 Vi 到 w 和 从 Vi 到 vi 都 
存在 路 径 ， 则 称 G 是 强 连 通 图 。 有 向 图 中 的 极 大 强 连 通 子 图 和 se CAT Fa 
的 强 连 通 分 量 。 例 如 图 7-2-13， 图 1 并 不 是 强 连通 图 ， 因为 顶点 A 到 顶点 
D 存 在 路 径 ， 而 D 到 A 就 不 存在 。 图 2 束 是 强 连 通 图 ， 而 且 显 然 图 2 是 图 1 
的 极 大 强 连 通 子 图 ， 即 是 它 的 强 连 通 分 量 。 








图 7-2-13 


现在 我 们 再 来 看 连通 图 的 生成 树 定义 。 


所 谓 的 一 个 连通 图 的 生成 树 是 一 个 极 小 的 连通 子 图 ， 和 含有 图 中 全 部 的 
n 个 顶点 ， 但 只 有 足以 构成 一 柠 树 的 n-1 条 边 。 比 如 图 7-2-14 的 图 1 是 一 普 
通 图 ， 但 显然 它 不 是 生成 树 ， 当 去 挥 两 条 构成 环 的 边 后 ， 比 如 图 2 或 图 
3， 就 满足 n 个 顶 皮 n-1 条 边 且 连 通 的 定义 了 。 它 们 都 是 一 村 生 成 树 。 从 

这 里 也 可 知道 ， 如 末 一 个 图 有 n 个 顶点 和 小 于 n-1 条 边 ， 则 是 非 连 通 图 ， 

如 条 它 多 于 n-1 边 条 ， 必 定 构成 一 个 环 ， 因 为 这 条 边 使 得 它 依附 的 那 两 

个 顶点 之 间 有 了 第 二 条 路 径 。 比 如 图 2 和 图 3， 随 便 加 哪 两 顶点 的 边 都 将 
构成 环 。 不 过 有 n-1 条 边 并 不 一 定 是 生成 树 ， 比 如 图 4。 
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图 7-2-14 


如 宁 一 个 有 回 图 恰 有 一 个 顶点 的 入 度 为 0， 其 余 顶 点 的 入 度 均 为 1， 则 征 
一 个 有 回 树 。 对 有 回 树 的 理解 比较 容易 ， 所 谓 入 度 为 0 其 实 就 相当 于 树 
中 的 根 结 点 ， 其 余 顶点 入 度 为 1 就 是 说 树 的 非 根 结 点 的 双 杀 只 有 一 个 。 
一 个 有 癌 图 的 生成 森林 由 耕 干 柠 有 疝 树 组 成 ， 含 有 图 中 全 部 项 操 ， 但 只 
有 足以 构成 大 干 村 不 相交 的 有 问 树 的 弧 。 如 图 7-2-15 的 图 1 是 一 柠 有 向 
图 。 去 挥 一 些 缴 后 ， 它 可 以 分 解 为 两 检 有 向 树 ， 如 图 2 和 图 3， 这 两 村 束 
古 图 1 有 问 图 的 生成 森林 。 














图 7-2-15 








7.24 ”图 的 定义 与 术语 总 结 





术语 终于 介绍 得 兰 不 多 了 ， 可 能 有 不 少 同学 有 些 头 晤 ， 我 们 再 来 整理 一 
Be 





图 按照 有 无 方向 分 为 无 同 图 和 有 癌 图 。 无 癌 图 由 顶点 和 边 构 成 ， 有 向 图 
由 顶点 和 弧 构成 。 弧 有 弧 尾 和 弧 涉 之 分 。 


图 按照 边 或 弧 的 多 少 分 稀 跑 图 和 稠密 图 。 如 果 任 意 两 个 项 点 之 间 痢 存在 
ae ee ne DR A 
叫 简单 图 。 











图 中 顶点 之 间 有 邻接 点 、 依 附 的 概念 。 无 癌 图 顶点 的 边 数 叫做 度 ， 有 加 
图 顶点 分 为 入 度 和 出 度 。 


图 上 的 边 或 弧 上 带 权 则 称 为 网 。 


图 中 顶点 间 存 在 路 径 ， 两 顶点 存在 路 径 则 说 明 是 连通 的 ， 如 果 路 径 最 终 
回 到 起 始点 则 称 为 环 ， 当 中 不 重复 叫 简单 路 径 。 奋 任意 两 顶点 都 是 连通 
的 ， 则 图 就 是 连通 图 ， 有 向 则 称 强 连通 图 。 图 中 有 子 图， 奉子 图 极 大 连 
通则 就 是 连通 分 量 ， 有 向 的 则 称 强 连通 分 量 。 








无 向 图 中 连通 且 n 个 顶点 n-1 条 边 叫 生成 树 。 有 癌 图 中 一 顶点 入 上 度 为 0 其 
NR TS 








7.3 ”图 的 抽象 数据 类 型 


图 作为 一 种 数据 结构 ， 它 的 抽象 数据 类 型 带 有 上 自己 特点 ， 正 因为 它 的 复 
杂 ， 运 用 广泛 ， 使 得 不 同 的 应 用 需要 不 同 的 运算 集合 ， 构 成 不 同 的 抽象 
数据 操作 。 我 们 这 里 就 来 看 看 图 的 基本 操作 。 








ADT 图 (Graph) 








































































































































































































Data 
顶点 的 有 穷 非 空 集合 和 边 的 集合 。 
Operation 
CreateGraph(*G, V, VR): 按照 顶点 集 V 和 边 弧 集 VR 的 定义 构造 图 6。 
DestroyGraph(*6): 图 6 存在 则 销毁 。 
LocateVex(G, u): 若 图 G6 中 存在 顶点 u， 则 返回 图 中 的 位 置 。 
GetVex(G, V): 返回 图 6 中 顶点 v 的 值 。 
PutVex(G, V, value): 将 图 G 中 顶点 v 赋 值 value。 
FirstAdjVex(G, *v): 返回 顶点 v 的 一 个 邻接 项 点 ， 若 顶点 在 G 中 无 邻接 顶点 返回 空 。 
NextAdjVex(G, v, *w): ”返回 顶点 v 相 对 于 顶点 w 的 下 一 个 邻接 顶点 ， 
若 w 是 v 的 最 后 一 个 邻接 点 则 返回 “ 空 ”。 
TnsertVex(*G, v): 在 图 6 中 增添 新 顶点 v。 
DeleteVex(*G, v): 删除 图 G 中 顶点 v 及 其 相关 的 弧 。 
TnsertArc(*G, V, w): 在 图 6 中 增添 弧 <v, w>， 若 G 是 无 向 图 ， 还 需要 增添 对 称 弧 <w, V>。 
DeleteArc(*G, v, w): 在 图 6 中 删除 弧 <v, w>， 若 6 是 无 向 图 ， 则 还 删除 对 称 弧 <w, v>。 
DFSTraverse(G): 对 图 6 中 进行 深度 优先 遍历 ， 在 遍历 过 程 对 每 个 顶点 调用 。 
HFSTraverse(G) : 对 图 G 中 进行 广度 优先 遍历 ， 在 遍历 过 程 对 每 个 顶点 调用 





























endADT 


7.4 ”图 的 存储 结构 


图 的 存储 结构 相 较 线性 表 与 树 来 说 束 更 加 复杂 了 。 首 先 ， 我 们 口 涉 上 说 


辑 结 构 定 义 来 看 ， 图 上 任何 一 个 顶点 都 可 被 看 成 是 第 一 个 顶点 ， 任 一 项 
点 的 邻接 点 之 间 也 不 存在 次 序 关 系 。 比 如 图 7-4-1 中 的 四 张 图 ， 仔 细 观 察 
发 现 ， 它 们 其 实 是 同一 个 图 ， 只 不 过 顶点 的 位 置 不 同 ， 就 造成 了 表象 上 
不 太一 样 的 感觉 。 








图 7-4-1 





也 正 由 于 图 的 结构 比较 复杂 ， 任 意 两 个 顶点 之 间 都 可 能 存在 联系 ， 因 此 
无 法 以 数据 元 素 在 内 存 中 的 物理 位 置 来 表示 元 素 之 间 的 关系 ， 也 就 是 

说 ， 图 不 可 能 用 简单 的 顺序 存储 结构 来 表示 。 而 多 重 链表 的 方式 ， 即 以 
一 个 数据 域 和 多 个 指针 域 组 成 的 结 点 表示 网 中 的 一 个 项 点， 尽管 可 以 实 
现 图 结构 ， 但 其 实在 树 中 ， 我 们 也 已 经 讨论 过 ， 这 是 有 问题 的 。 如 果 各 
个 顶点 的 度数 相差 很 大 ， 按 度数 最 大 的 顶点 设计 结 点 结构 会 造成 很 多 存 
储 单元 的 浪费 ， 而 知 按 每 个 顶点 自己 的 度数 设计 不 同 的 顶点 结构 ， 又 带 
来 操作 的 不 便 。 因 此 ， 对 于 图 来 说 ， 如 何 对 它 实 现 物理 存储 是 个 难题 ， 
己 经 解决 了 ， 现 在 我 们 来 看 前 非 们 提供 的 五 种 不 同 的 
TM ZM o 

















7.4.1 邻接 和 矩阵 


考虑 到 图 是 由 顶点 和 边 或 弧 两 部 分 组 成 。 合 在 一 起 比较 困难 ， 那 就 很 自 
然 地 考虑 到 分 两 个 结构 来 分 别 存储 。 顶 点 不 分 大 小 、 主 次 ， 所 以 用 一 个 
一 维 数组 来 存储 是 很 不 错 的 选择 。 而 边 或 弧 由 于 是 顶点 与 顶点 之 间 的 关 
系 ， 一 维 搞 不 定 ， 那 就 考虑 用 一 个 二 维 数组 来 存储 。 于 是 我 们 的 邻接 算 
阵 的 方案 束 诞 生 了 。 


图 的 邻接 矩阵 (Adjacency Matrix) 存储 方式 是 用 两 个 数组 来 表示 图 。 
一 个 一 维 数组 存储 图 中 顶点 信息 ， 一 个 二 维 数组 〈 称 为 邻接 窍 阵 ) 存储 
图 中 的 边 或 弧 的 信息 。 


设 图 G 有 n 个 顶点 ， 则 邻接 矩阵 是 一 个 nxn 的 方 阵 ， 定 义 为 : 
オト \ 
(ov, )E ER <v, >EE 
\ 
,及 


我 们 来 看 一 个 实例 ， 图 7-4-2 的 左 图 就 是 一 个 无 向 图 。 


arcfillj] = 





EHAA 
图 7-4-2 


我 们 可 以 设置 两 个 数组 ， 顶 点 数组 为 ver-tex[4]={Vo,vi,V2,V3}， 边 数组 
arc[4][4] 为 图 7-4-2 右 图 这 样 的 一 个 和 矩阵。 简单 解释 一 下 ， 对 于 矩阵 的 主 
对 角 线 的 值 ， 即 arc[0][0]、arc[1][1]、arc[2][2]、arc[3][3]， 全 为 0 是 因为 
不 存在 顶点 到 自身 的 边 ， 比 如 vo 到 vo。arc[0][1]=1 是 因为 vo 到 vj 的 边 存 
在 ， 而 arc[1][3]=0 是 因为 vi 到 vs 的 边 不 存在 。 并 且 由 于 是 无 加 图 ，vi 到 v， 
的 边 不 存在 ， 意 味 着 va 到 vi 的 边 也 不 存在 。 所 以 无 癌 图 的 边 数组 是 一 个 
对 称 和 矩阵 。 














E? 对 称 和 矩阵 是 什么 ? 未 记 了 不 要 紧 ， 复 习 一 下 。 所 谓 对 称 矩 阵 就 是 n 


也 知 隆 的 元 満足 a=a (0sijsn) 。 即 从 矩阵 的 元 上 角 到 右 下 角 的 主 对 
角 线 为 轴 ， 右 上 角 的 元 与 左下 角 相 对 应 的 元 全 都 是 相等 的 。 


有 了 这 个 和 矩阵， 我 们 就 可 以 很 容易 地 知道 图 中 的 信息 。 

1. 我 们 要 判定 任意 两 顶点 是 否 有 边 无 边 就 非常 容易 了 。 

2. 我 们 要 知道 某 个 顶点 的 度 ， 其 实 就 是 这 个 顶点 vi 在 邻接 矩阵 中 第 i 行 
(或 第 i 列 )〉 的 元 素 之 和 。 比 如 顶点 vj 的 度 就 是 1+0+1+0=2。 

3. 求 顶点 vi 的 所 有 邻接 点 就 是 将 算 阵 中 第 i 行 元 素 扫 描 一 遍 ，arc[ 记 [j] 为 1 
就 是 邻接 点 。 














我 们 再 来 看 一 个 有 问 图 样 例 ， 如 图 7-4-3 所 示 的 左 图 。 
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VAR AI 


图 7-4-3 


顶点 数组 为 vertex[4]={v0,v1,v2,vV3}， 弧 数组 arc[4][4] 为 图 7-4-3 右 图 这 样 
的 一 个 矩阵 。 主 对 角 线 上 数值 依然 为 0。 但 因为 是 有 问 图 ， 所 以 此 和 矩阵 
并 不 对 称 ， 比 如 由 v1 到 vo 有 弧 ， 得 到 arc[1][0]=1， 而 vo 到 vj 没有 弧 ， 因 此 
arc[0][1]=0. 


有 疝 图 讲究 入 上 度 与 出 度 ， 顶 点 vi 的 入 度 为 1， 正 好 是 第 V1 列 各 数 之 和 。 
顶点 Vi 的 出 度 为 2， 即 第 Vi 行 的 各 数 之 和 。 





与 无 同 图 同样 的 办 法 ， 判 断 项 皮 vi 到 vj 是 否 存 在 弧 ， 只 需要 伍 找 矩阵 中 
arc[ilj] 是 人 否 为 1 即 可 。 要 求 w 的 所 有 邻接 点 就 是 将 矩阵 第 i 行 元 素 扫 摘 一 
ii, Akari] j ALR. 





在 图 的 术语 中 ， 我 们 提 到 了 网 的 概念 ， 也 就 是 每 条 边 上 带 有 权 的 图 叫做 
网 。 那 么 这 些 权 值 就 需要 存 下 来 ， 如 何 处 理 这 个 矩阵 来 适应 这 个 需求 
Ne? 我 们 有 办 法 。 








设 图 G 是 网 图 ， 有 pn 个 顶点 ， 则 邻接 矩阵 是 一 个 nxn 的 方 阵 ， 定 义 为 : 





这 里 Wi 表示 《vivj) 或 <vbvi> 上 的 权 值 。% 表 示 一 个 计算 机 允许 的 、 大 
于 所 有 边 上 权 值 的 值 ， 也 束 是 一 个 不 可 能 的 极限 值 。 有 同学 会 问 ， 为 什 
么 不 是 0 呢 ? 原 因 在 于 权 值 wi 大 多 数 情 况 下 是 正 值 ， 但 个 别 时候 可 能 残 
是 0， 甚 至 有 可 能 是 负 值 。 因 此 必须 要 用 一 个 不 可 能 的 值 来 代表 不 存 
在 。 如 图 7-4-4 左 图 就 是 一 个 有 辣 网 图 ， 右 图 惑 是 它 的 邻接 矩阵 。 
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图 7-4-4 





那么 邻接 矩阵 是 如 何 实现 图 的 创建 的 昵 ?我 们 先 来 看 看 图 的 邻接 矩阵 存 
储 的 结构 ， 代 码 如 下 。 














/* 顶点 类 型 应 由 用 户 定义 */ 
ae aha VertexType; 

* 边 上 的 权 值 类 型 应 由 用 户 定义 */ 
a int EdgeType; 
/* 最 大 项 点数， 应 由 用 户 定义 */ 
#define MAXVEX 100 
/* 用 65535 来 代表 o */ 
#define INFINITY 65535 







































































typedef struct 
d 


/* MAR */ 
VertexType vexS[MAXVEX] ; 
/* 邻接 和 矩阵， 可 看 作 边 表 */ 
EdgeType arc[MAXVEX] [MAXVEX] ; 
/* 图 中 当前 的 顶点 数 和 边 数 */ 

int numVertexes, numEdges; 
} MGraph; 























有 了 这 个 结构 定义 ， 我 们 构造 一 个 图 ， 其 实 就 是 给 顶点 表 和 边 表 输入 数 
据 的 过 程 。 我 们 来 看 看 无 回 网 图 的 创建 代码 。 





/* 建立 无 向 网 图 的 邻接 矩阵 表示 */ 
void CreateMGraph(MGraph *G) 







































































{ 

aiae al alo UG AIR 

printf(" 縮 入 頂 点数 和 辺 数 :\n"): 

/* 输入 顶点 数 和 边 数 */ 

scanf("%d,%d", &G->numVertexes, &G->numEddeS ) 

/* 读 入 顶点 信息 ， 建 立 顶点 表 */ 

for (i = 0; i < G->numVertexes; i++) 
scanf(&G->vexs[i]); 

for (i = 0; i < G->numVertexes; i++) 
for (j = 0; j <G->numVertexes; j++) 

/* 邻接 矩阵 初始 化 */ 
G->arc[i][j] = INFINITY; 

/* 读 入 numEdges 条 边 ， 建 立 邻 接 矩 阵 */ 

for (k = 0; k < G->numEdges; k++) 

{ 
printf(" 输 入 边 (vi,vj) 上 的 下 标 i， 下 标 j 和 权 w:\n"); 
/* 输入 边 (vi,vj) 上 的 权 w */ 
scanf("%d,%d,%d", Q&I &j, &w); 
G->arc[i][j] = w; 
/* 因为 是 无 向 图 ， 和 矩阵 对 称 */ 
G->arc[j][i] = G->arc[i][j]; 

} 

} 


从 代码 中 也 可 以 得 到 ，n 个 项 点 和 e 条 边 的 无 癌 网 图 的 创建 ， 时 间 复 杂 度 
为 O(nt+n”+e)， 其 中 对 邻接 矩阵 G.arc 的 初始 化 耗费 了 On) 的 时 间 。 


7.4.2 部 接 表 


邻接 矩阵 是 不 错 的 一 种 图 存储 结构 ， 但 是 我 们 也 友 现 ， 对 于 边 数 相对 顶 
扩 较 少 的 图 ， 这 种 结构 是 存在 对 存储 空间 的 极 大 浪费 的 。 比 如 说 ， 如 果 
我 们 要 处 理 图 7-4-5 这 样 的 稀疏 有 问 图 ， 邻 接 和 矩阵 中 除了 arc[1J[0] 有 权 值 





外 ， 没 有 其 他 弧 ， 其 实 这 些 存 储 空间 都 浪费 挥 了 。 
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图 7-4-5 


因此 我 们 考虑 另外 一 种 存储 结构 方式 。 回 忆 我 们 在 线性 表 时 谈 到 ， 
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存储 结构 就 存在 预先 分 配 内 存 可 能 造成 存储 空间 浪费 的 问题 ， 于 是 引出 
了 链 式 存储 的 结构 。 同 样 的 ， 我 们 也 可 以 考虑 对 边 或 弧 使 用 链 式 存储 的 
方式 来 避 倪 空间 浪费 的 问题 。 


再 回忆 我 们 在 树 中 谈 存 储 结构 时 ， 讲 到 了 一 种 孩子 表示 法 ， 将 结 点 存 入 
数组 ， 并 对 结 点 的 孩子 进行 链 式 存储 ， 不 管 有 多 少 孩 子 ， 也 不 会 存在 空 
间 浪 费 问 题 。 这 个 思路 同样 适用 于 图 的 存储 。 我 们 把 这 种 数组 与 链表 相 
结合 的 存储 方法 称 为 邻接 表 (Ad-jacency List) 。 


邻接 表 的 处 理 办 法 是 这 样 。 


1. 图 中 顶点 用 一 个 一 维 数组 存储 ， 当 然 ， 顶 点 也 可 以 用 单 链 表 来 存储 ， 
不 过 数组 可 以 较 容 易 地 读 取 顶 点 信息 ， 更 加 方便 。 为 外 ， 对 于 顶点 数 组 
中 ， 每 个 数据 元 素 还 需要 存储 指 问 第 一 个 邻接 点 的 指针 ， 以 便于 俘 找 该 
顶点 的 边 信 息 。 

2. 图 中 每 个 顶点 Vi 的 所 有 邻接 点 构成 一 个 线性 表 ， 由 于 邻接 点 的 个 数 不 
定 ， 所 以 用 单 链表 存储 ， 无 向 图 称 为 顶点 Vi 的 边 表 ， 有 向 图 则 称 为 顶点 
vi 作为 弧 尾 的 出 边 表 。 











例如 图 7-4-6 所 示 的 残 古 一 个 无 回 图 的 邻接 表 结 构 。 
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图 7-4-6 


从 图 中 我 们 知道 ， 顶 点 表 的 各 个 结 点 由 data 和 firstedge 两 个 域 表 示 ，data 
是 数据 域 ， 存 储 顶 点 的 信息 ，firstedge 是 指针 域 ， 指 向 边 表 的 第 一 个 结 
点 ， 即 此 顶点 的 第 一 个 邻接 点 。 边 表 结 点 由 adjvex 和 next 两 个 域 组 成 。 
adjvex 是 邻接 点 域 ， 存 储 某 顶点 的 邻接 点 在 顶点 表 中 的 下 标 ，next 则 存 
储 指 向 边 表 中 下 一 个 结 点 的 指针 。 比 如 vj 顶点 与 Vo、V, 互 为 邻接 点 ， 则 
在 V1 的 边 表 中 ，adjvex 分 别 为 vo 的 0 和 Vv, 的 2。 











这 样 的 结构 ， 对 于 我 们 要 获得 图 的 相关 信息 也 是 很 方便 的 。 比 如 我 们 要 
想 知道 某 个 顶点 的 度 ， 就 去 查找 这 个 顶点 的 边 表 中 结 点 的 个 数 。 知 要 判 
断 顶 皮 Vi 到 vj 是 否 存 在 边 ， 只 需要 测试 项 点 vi 的 边 表 中 adjvex 是 否 存 在 结 
尽 Vi 的 下 标 j 就 行 了 。 右 求 顶 皮 的 所 有 邻接 点 ， 其 实 束 是 对 此 顶点 的 边 表 
进行 遍历 ， 得 到 的 adjvex 域 对 应 的 顶点 就 是 邻接 点 。 














知 是 有 向 图 ， 邻 接 表 结 构 是 类 似 的 ， 比 如 图 7-4-7 中 第 一 幅 图 的 邻接 表 就 
征 第 二 幅 图 。 但 要 注意 的 是 有 辐 图 由 于 有 方向 ， 我 们 是 以 顶点 为 弧 尾 来 
存储 边 表 的 ， 这 样 很 容易 就 可 以 得 到 每 个 项 点 的 出 上 度 。 但 也 有 时 为 了 便 








PE TUR ABET ASK AIS, 我 休 可 以 建立 一 人 有 了 向 図 的 逆 
邻接 表 ， 即 对 每 个 顶点 vi 都 建立 一 个 链接 为 vi 为 弧 尖 的 表 。 如 图 7-4-7 的 
第 三 幅 图 所 示 。 
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图 7-4-7 





此 时 我 们 很 容易 就 可 以 算出 茶 个 顶点 的 入 度 或 出 度 是 多 少 ， 判 断 两 顶点 
古 否 存在 弧 也 很 容易 实现 。 


对 于 币 权 值 的 网 图 ， 可 以 在 边 表 结 点 定义 中 再 增加 一 个 weight 的 数据 
域 ， 和 存储 权 值 信息 即 可 ， 如 图 7-4-8 所 示 。 
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图 7-4-8 


有 了 这 些 结构 的 图 ， 下 面 关 于 结 点 定义 的 代码 就 很 好 理解 了 。 

















/* 顶点 类 型 





应 由 用 户 定义 */ 








typedef char VertexTyDe: 

/* 边 上 的 权 值 类 型 应 由 用 户 定义 */ 
typedef int EdgeType; 

/* 边 表 结 点 */ 

typedef struct EdgeNode 























/* 邻接 点 域 ， 存 储 该 顶点 对 应 的 下 标 */ 
int adjvex; 
/* 用 于 存储 权 值 ， 对 于 非 网 图 可 以 不 需要 */ 
EdgeType weight; 
/* 链 域 ， 指 向 下 一 个 邻接 点 */ 
struct EdgeNode *next; 

} EdgeNode; 

/* 顶点 表 结 点 */ 

typedef struct VertexNode 

dl 












































/* 顶点 域 ， 存 储 顶 点 信息 */ 
VertexType data; 
a 
EdgeNode *firstedge; 
} VertexNode, AdjList[MAXVEX]; 
typedef struct 


AdjList adjList; 

/* 图 中 当前 顶点 数 和 边 数 */ 

int numVertexes, numEdges; 
} GraphAdjList; 























对 于 邻接 表 的 创建 ， 也 就 是 顺理成章 之 事 。 无 疝 图 的 邻接 表 创 建 代 码 如 
Ts 


/* 建立 图 的 邻接 表 结构 */ 
void CreateALGraph(GraphAdjList *G) 
{ 





ON aly Spa We 

EdgeNode *e; 
printf(" 縮 入 頂 点数 和 辺 数 :\n"): 

/* 输入 顶点 数 和 边 数 */ 

scanf("%d,%d", &G->numVertexes, 
&G->numEdges ) ; 

/* 读 入 顶点 信息 ， 建 立 顶点 表 */ 

for (i = 0; i < G->numVertexes; i++) 























{ 
/* 输入 顶点 信息 */ 
scanf(&G->adjList[i].data) ; 
/* 将 边 表 置 为 空 表 */ 
G->adjList[i].firstedge = NULL; 
} 
/* 建立 辺 表 */ 
for (k = 0; k < G->numEdges; k++) 
{ 


printf(" 输 入 边 (vi,vj) 上 的 顶点 序号 :\n"); 
/* WAA (vi vj) ETAF S */ 
scanf("%d,%d", &1, &j); 

/* 向 内 存 申请 空间 ， */ 


/* 生成 边 表 结 点 */ 

e = (EdgeNode *)malloc(sizeof(EdgeNode) ) ; 
/* 邻接 序号 为 j] */ 

e->adjvex = j; 

从 将 6 指针 指 疝 当前 顶点 指向 的 结 上 の 

e->next = G->adjList[i].firstedge; 

/* 将 当前 顶点 的 指针 指向 e */ 

G->adjList[i].firstedge = e; 

/* 向 内 存 申请 空间 ， */ 

/* 生成 边 表 结 点 */ 

e = (EdgeNode *)malloc(sizeof(EdgeNode)); 

Wa */ 

e->adjvex = i; 

/* 将 e 指 针 指 向 当前 顶点 指向 的 结 点 */ 

e->next = G->adjList[j].firstedge; 

/* 将 当前 顶点 的 指针 指向 e */ 

G->adjList[j].firstedge = e; 














这 里 加 粗 代 码 ， 是 应 用 了 我 们 在 单 链表 创建 中 讲解 到 的 头 插 法 ， 由 于 对 
于 无 向 网 ， 一 条 边 对 应 都 是 两 个 项 点， 所 以 在 循环 中 ， 一 次 束 针 对 i 和 j 
分 别 进行 了 插入 。 本 算法 的 时 间 复 杂 度 ， 对 于 n 个 顶点 e 条 边 来 说， 很 容 
易 得 出 是 O(n+e)。 








7.4.3 HFK 











记得 看 过 一 个 创意 ， 我 非常 喜欢 。 次 的 是 在 美国 ， 晚 上 需要 保安 通过 视 
频 监 控 对 如 商场 超市 、 码 头 仓 库 、 办 公 写 字 楼 等 场所 进行 安保 工作 ， 如 
图 7-4-9 所 示 。 值 夜班 代价 总 是 比较 大 的 ， 所 以 人 员 成 本 很 高 。 我 们 国家 
的 一 位 老 郊 在 国内 经 芝 和 美国 的 朋友 视频 聊天 ， 但 总 为 白天 黑夜 的 时 差 
百 恼 ， 突 然 灵 感 一 来 ， 想 到 一 个 绝妙 的 皮子 。 他 创建 一 家 公司 ， 承 接 美 
国 客 户 的 视频 监控 任务 ， 因 为 美国 的 黑夜 就 是 中 国 的 白天 ， 利 用 互联 
网 ， 他 的 员工 白天 上 班 就 可 以 监控 到 美国 仓库 夜间 的 实际 情况 ， 如 果 发 
生 了 像 火灾 、 偷 盗 这 样 的 突 发 事件 ， 及 时 电话 到 美国 当地 相关 人 员 处 
理 。 由 于 利用 了 时 差 和 和 人员 成 本 的 优势 ， 这 位 老兄 发 了 大 财 。 这 个 创意 
让 我 们 知道 ， 充 分 利用 现 有 的 资源 ， 正 向 思维 、 逆 同 思 维 、 整 合 思 维 可 
以 创造 更 大 价值 。 














JH FIE k 
lew EDLE 


E aT | 
ANT 网 由 Mke EE | \ a à 
Pe . 





图 7-4-9 





那么 对 于 有 回 图 来 说 ， 邻 接 表 是 有 缺陷 的 。 关 心 了 出 度 问 题 ， 想 了 解 入 
度 束 必须 要 授 历 整 个 图 才能 知道 ， 反 之 ， 逆 邻接 表 解 决 了 入 度 却 不 了 解 
出 度 的 情况 。 有 没有 可 能 把 邻接 表 与 逆 邻 接 表 结合 起 来 呢 ? 答案 是 肯定 
的 ， 就 是 把 它们 整合 在 一 起 。 这 就 是 我 们 现在 要 讲 的 有 回 岁 的 一 种 存储 
方法 : 十 字 链 表 (Orthogonal List) 。 





我 们 重新 定义 顶点 表 结 点 结构 如 表 7-4-1 所 示 。 


表 7-4-1 


data firstin firstout 


其 中 firstin 表 示 入 边 表 头 指针 ， 指 同 该 顶点 的 入 边 表 中 第 一 个 结 点 ， 
firstout 表 示 出 边 表 头 指针 ， 指 向 该 顶点 的 出 边 表 中 的 第 一 个 结 点 。 


重新 定义 的 边 表 结 点 结构 如 表 7-4-2 所 示 。 


headink | tailink 


表 7-4-2 





其 中 tailvex 是 指 弧 起 点 在 顶点 表 的 下 标 ，headvex 是 指 弧 终点 在 顶点 表 中 
的 下 标 ，headlink 是 指 入 边 表 指针 域 ， 指 问 终 点 相同 的 下 一 条 边 ， 
taillink 是 指 边 表 指针 域 ， 指 同 起 点 相同 的 下 一 条 边 。 如 果 是 网 ， 还 可 以 
再 增加 一 个 weight 域 来 存储 权 值 。 


比如 图 7-4-10， 顶 点 依然 是 存 入 一 个 一 维 数组 {vouvivzva3}j， 实 线 箭头 指 
针 的 图 示 完 全 与 图 7-4-7 的 邻接 表 相 同 。 就 以 顶点 vo 来 说 ，firstout 指 回 的 
是 出 边 表 中 的 第 一 个 结 点 v3。 有 所 以 vo 边 表 结 点 的 headvex=3， 而 tailvex 其 
实 就 是 当前 顶点 vo 的 下 标 0， 由 于 vo 只 有 一 个 出 边 顶 点 ， 所 以 headlink 和 
taillink 都 是 空 。 
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图 7-4-10 





我 们 重点 需要 来 解释 虚线 箭头 的 含义 ， 它 其 实 就 是 此 图 的 逆 邻 接 表 的 表 
示 。 对 于 vo 来 说 ， 它 有 两 个 顶点 和 vz 的 入 边 。 因 此 vo 的 firstin 指 同 顶 点 


V1 的 边 表 结 点 中 headvex 为 0 的 结 点 ， 如 图 7-4-10 右 图 中 的 QD。 接 着 由 入 
边 结 点 的 headlink 指 向 下 一 个 入 边 顶点 v2， 如 图 中 的 所 。 对 于 顶点 v1， 它 
有 一 个 入 边 顶 点 v2， 所 以 它 的 firstin 指 辣 顶 点 v5 的 边 表 结 点 中 headvex 为 1 


的 结 点 ， 如 图 中 的 包 。 顶 点 Y> 和 Vs 也 是 同样 有 一 个 入 边 顶 点 ， 如 图 中 由 
MO. 


十 字 链 表 的 好 处 就 是 因为 把 邻接 表 和 逆 邻 接 表 整 合 在 了 一 起 ， 这 样 既 容 
易 找 到 以 Vi 为 尾 的 弧 ， 也 容易 找到 以 Vi 为 头 的 弧 ， 因 而 容易 求 得 顶点 的 
出 度 和 入 度 。 而 且 它 除了 结构 复杂 一 点 外 ， 其 实 创建 图 算法 的 时 间 复 杂 
度 是 和 邻接 表 相 同 的， 因此 ， 在 有 问 图 的 应 用 中 ， 十 字 链 表 是 非常 好 的 
数据 结构 模型 。 











7.4.4 邻接 多 重 表 





讲 了 有 回 图 的 优化 存储 结构 ， 对 于 无 癌 图 的 邻接 表 ， 有 没有 问题 呢 ? 如 
末 我 们 在 无 问 图 的 应 用 中 ， 关 注 的 重点 是 顶点 ， 那 么 邻接 表 是 不 错 的 选 
择 ， 但 如 果 我 们 更 关注 边 的 操作 ， 比 如 对 已 访问 过 的 边 做 标记 ， 删 除 某 
一 条 边 等 操作 ， 那 就 意味 着 ， 需 要 找到 这 条 边 的 两 个 边 表 结 点 进行 操 

作 ， 这 其 实 还 是 比较 抹 烦 的 。 比 如 图 7-4-11， 寿 要 删除 左 图 的 (vo,v2) 这 
条 边 ， 需 要 对 邻接 表 结 构 中 右边 表 的 阴影 两 个 结 点 进行 删除 操作 ， 显 然 
这 是 比较 烦琐 的 。 
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图 7-4-11 


因此 ， 我 们 也 仿照 十 字 链 表 的 方式 ， 对 边 表 结 点 的 结构 进行 一 些 改造 ， 
也 许 就 可 以 避免 刚才 提 到 的 问题 。 


重新 定义 的 边 表 结 点 结构 如 表 7-4-3 所 示 。 


ie [j 


表 7-4-3 


其 中 ivex 和 jvex 是 与 东 条 边 依 附 的 两 个 顶点 在 顶点 表 中 的 下 标 。ilink 指 
加 依附 顶点 ivex 的 下 一 条 边 ，jlink 指 同 依 附 项 点 jvex 的 下 一 条 边 。 这 就 
是 邻接 多 重 表 结 构 。 





我 们 来 看 结构 示意 图 的 绘制 过 程 ， 理 解 了 它 是 如 何 连 线 的 ， 也 就 理解 邻 
接 多 重 表 构造 原理 了 。 如 图 7-4-12 所 示 ， 左 图 告诉 我 们 它 有 4 个 顶点 和 5 
条 边 ， 显 然 ， 我 们 束 应 该 先 将 4 个 顶点 和 5 条 边 的 边 表 绪 点 画 出 来 。 由 于 
是 无 同 图 ， 所 以 ivex 是 0、jvex 是 1 还 是 反 过 来 都 是 无 所 谓 的 ， 不 过 为 了 
绘图 方便 ， 都 将 ivex 值 设置 得 与 一 劳 的 顶点 下 标 相 同 。 
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图 7-4-12 


我 们 开始 连 线 ， 如 图 7-4-13。 首 先 连 线 的 CDC)G) 约 就 是 将 顶点 的 firstedge 
指 问 一 条 边 ， 顶 皮下 标 要 与 ivex 的 值 相同 ， 这 很 好 理解 。 接 着 ， 由 于 项 
点 Vo 的 (vov1) 边 的 邻 边 有 (Vo,v3) 和 (Vo,V») o KOGO 的 连 线 就 是 满足 指 jaj 


下 一 条 依附 于 顶点 vo 的 边 的 目标 ， 注 意 ilink 指 向 的 结 点 的 jvex 一 定 要 和 
它 本 身 的 ivex 的 值 相同 。 同 样 的 道理 ， 连 线 @ 就 是 指 (v1,v0) 这 条 边 ， 它 
是 相当 于 顶点 Vi 指向 (vj,v2) 边 后 的 下 一 条 。vV2 有 三 条 边 依 附 ， 所 以 在 @) 
之 后 就 有 了 (9@。 连 线 四 的 就 是 顶点 va 在 连 线 由 之 后 的 下 一 条 边 。 左 图 
一 共有 5 条 边 ， 所 以 右 图 有 10 条 连 线 ， 完 全 符合 预期 。 
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图 7-4-13 


到 这 里 ， 大 家 应 该 可 以 明白 ， 邻 接 多 重 表 与 邻接 表 的 差别 ， 仅 仅 是 在 于 
同一 条 边 在 邻接 表 中 用 两 个 结 点 表示 ， 而 在 邻接 多 重 表 中 只 有 一 个 结 
扩 。 这 样 对 边 的 操作 束 方 便 多 了 了， 大 要 删除 左 图 的 (vo,v2) 这 条 边 ， 只 需 
要 将 右 图 的 @@ 的 链接 指向 改 为 人 即 可 。 由 于 各 种 基本 操作 的 实现 也 和 
邻接 表 是 相似 的 ， 这 里 我 们 就 不 讲解 代码 了 。 








7.4.5 边 集 数 组 


边 集 数 组 是 由 两 个 一 维 数组 构成 。 一 个 是 存储 顶点 的 信息 ; 另 一 个 是 存 
储 边 的 信息 ， 这 个 边 数 组 每 个 数据 元 素 由 一 条 边 的 起 点 下 标 

(begin) 、 终 点 下 标 Cend) 和 权 (weight) 组 成 ， 如 图 7-4-14 所 示 。 
然 边 集 数组 关注 的 是 边 的 集 ， 在 边 集 数组 中 要 查找 一 个 顶点 的 度 需 
扫 摘 整个 边 数 组 ， Ma. 因此 它 更 适合 对 边 依 次 进行 处 理 的 操 
作 ， 而 不 适合 对 顶点 相关 的 操作 。 关 于 边 集 数组 的 应 用 我 们 将 在 本 章 
7.6.2 节 的 克 鲁 斯 卡尔 〈Kruskal) 算法 中 有 介绍 ， 这 里 就 不 再 详 述 了 。 
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图 7-4-14 


定义 的 边 数 组 结构 如 表 7-4-4 所 示 。 


表 7-4-4 


begin end weight 


其 中 begin 是 存储 起 点 下 标 ，end 是 存储 终点 下 标 ，weight 是 存储 权 值 。 


7.5 图 的 壳 历 


我 有 天 早 展 准备 出 门 ， 发 现 钥匙 不 见 了 。 昨 晚 还 看 到 它 ， 所 以 确定 钥匙 
在 家 里 。 一 定 是 我 那 三 岁 不 到 的 儿子 拿 着 玩 ， 不 知道 丢 到 哪个 特 角 各 晃 
去 了 ， 问 他 也 说 不 清楚 。 我 现在 必须 得 找到 它 ， 你 们 说 ， 我 应 该 如 何 

R? 介绍 我 们 家 的 结构 ， 如 图 7-5-1 所 示 ， 是 最 典型 的 两 室 两 厅 一 厨 一 卫 
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图 7-5-1 


有 人 说 ， 往 小 孩子 经 常 玩 的 地 方 找 找 看 。OK， 我 照 做 了 ， 可 异 没 找 
P AREA? 有 人 说 一 间 一 间 找 ， 可 怎么 个 找 法 ? 是 把 一 间 房 间 翻 
个 底 朝 天 再 找 下 一 间 好 呢 ， 还 是 先 每 个 房间 的 最 第 去 的 位 置 找 一 找 ， 然 
后 再 一 步 一 步 细 化 到 每 个 房间 的 角落 ? 











这 是 一 个 大 家 都 可 能 会 面临 的 问题 ， 不 找 的 东西 时 向 抑 ， 需 要 的 东西 寻 
不 着 。 找 东西 的 策略 也 因 人 而 录 。 有 些 人 因为 找 东西 没有 规划 ， 当 一 样 
东西 找 不 到 时 ， 往 往 会 反复 地 找 ， 甚 至 茶 些 抽 层 找 个 四 五 沉 ， 男 一 些 地 
方 却 一 次 也 没 找 过 。 找 东西 是 没有 什么 标准 方法 的 ， 不 过 今天 我 们 学 过 
了 图 的 明 历 以 后 ， 你 至 少 应 该 在 找 东 西 时 ， 更 加 科学 地 规划 寻找 方案 ， 
而 不 至 于 手忙脚乱 。 





图 的 过 历 是 和 树 的 过 历 类 似 ， 我 们 硕 望 从 图 中 某 一 顶点 出 用 访 过 图 中 其 
余 顶 点 ， 且 使 每 一 个 顶点 仅 被 访问 一 次 ， 这 一 过 程 就 叫做 图 的 过 历 
(Traversing Graph) 。 


树 的 遍历 我 们 谈 到 了 四 种 方案 ， 应 该 说 都 还 好 ， 毕 葛根 结 点 只 有 一 个 ， 
避 历 都 是 从 它 发 起 ， 其 余 所 有 结 点 都 只 有 一 个 双亲 。 可 图 就 复杂 多 了 ， 
因为 它 的 任 一 顶点 都 可 能 和 其 余 的 所 有 顶点 相 邻 接 ， 极 有 可 能 存在 沿 着 
菏 条 路 径 搜 索 后 ， 又 回 到 原 顶 点 ， 而 有 些 顶 点 却 还 没有 过 有 历 到 的 情况 。 
因此 我 们 需要 在 所 历 过 程 中 把 访问 过 的 项 点 打上 标记 ， 以 避免 访问 多 次 
而 不 上 自 知 。 具 体 办 法 是 设置 一 个 访问 数组 visited[n]，n 是 图 中 顶 皮 的 个 
数 ， 初 值 为 0， 访 问 过 后 设置 为 1。 这 其 实在 小 说 中 常常 见 到 ， 一 行人 在 
生還 pee erie ez 
Tiis 











A RRL, WERA ARK CEI, 就 需要 科学 地 疫 半周 
历 方案 ， 通 常 有 两 种 遍历 次 序 方案 ， 它 们 是 深度 优先 遍历 和 广度 优先 遍 
历 。 





7.5.1 深度 优先 遍历 


深度 优先 遍历 (Depth_EFirst_Search) ， 也 有 称 为 深度 优先 搜索 ， 简 称 为 
DFS。 它 的 具体 思想 惑 如 同 我 刚才 提 到 的 找 钥匙 方案 ， 无 论 从 哪 一 间 房 
间 开 始 都 可 以 ， 比 如 主 睹 室 ， 然 后 从 房间 的 一 个 角 开 始 ， 将 房间 内 的 墙 
角 、 床 头 柜 、 床 上 、 床 下 、 衣 柜 里 、 衣 柜上 、 前 面 的 电视 柜 等 挨个 寻 
找 ， 做 到 不 放 过 任何 一 个 死角 ， 所 有 的 抽 展 、 储 藏 柜 中 全 部 都 找 遂 ， 形 
象 比 喻 就 是 翻 个 底 胃 天 ， 然 后 再 寻找 下 一 间 ， 直 到 找到 为 止 。 





为 了 更 好 的 理解 深度 优先 遍历 ， 我 们 来 做 一 个 游戏 。 


假设 你 需要 完成 一 个 任务 ， 要 求 你 在 如 图 7-5-2 左 图 这 样 的 一 个 迷宫 中 ， 
从 顶点 A 开始 要 走 志 所 有 的 图 顶点 并 作 上 标记 ， 注 意 不 是 简单 地 看 着 这 
ae 面 起 如 同 現 突 般 地 在 具有 高 増 和 通 道 的 迷宮 中 去 完成 
EF 0 














显然 我 们 是 需要 全 略 的 ， 耕 则 在 这 四 通 八 达 的 通道 中 乱 富 ， 要 想 完成 
和 \ 能 是 碰 运 气 。 如 果 你 学 过 深度 优先 遍历 ， 这 个 任务 就 不 难 完 


首先 我 们 从 顶点 A 开始 ， 做 上 表示 走 过 的 记号 后 ， 面 前 有 两 条 路 ， 通 向 
B 和 F， 我 们 给 自己 定 一 个 原则 ， 在 没有 碰 到 重复 顶点 的 情况 下 ， 始 终 
是 向 右手 边 走 ， 于 是 走 到 了 B 顶 点 。 整 个 行路 过 程 ， 可 参看 图 7-5-2 的 右 
图 。 此 时 发 现 有 三 条 分 支 ， 分 别 通 向 顶点 C、I、G， 右 手 通 行 原则 ， 使 
得 我 们 走 到 了 C 顶 点 。 就 这 样 ， 我 们 一 直 顺 着 右手 通道 走 ， 一 直 走 到 F 
顶点 。 当 我 们 依然 选择 右手 通道 走 过 去 后 ， 发 现 走 回 到 顶点 A 了 ， 因 为 
在 这 里 做 了 记号 表示 已 经 走 过 。 此 时 我 们 退回 到 顶点 FE， 走 向 从 右 数 的 
第 二 条 通道 ， 到 了 G 顶 点 ， 它 有 三 条 通道 ， 发 现 B 和 DD 都 已 经 是 走 过 的 ， 

ee eel 通 向 H 的 两 条 通道 D 和 E 时 ， 会 发 现 都 已 经 走 过 






































此 时 我 们 是 否 已 经 毅 历 了 所 有 顶点 呢 ? 没 有 。 可 能 还 有 很 多 分 支 的 顶点 
我 们 没有 走 到 ， 所 以 我 们 按 原 路 返回 。 Ne 再 元 通 道 Se 

返 回 色 G, 也 元 未 走 赴 通 道 , 返 回 色 F, 没有 通 道 , 返 回 色 E, 有一 Kl 

道 通 往 了 的 通道 ， 验 证 后 也 是 走 过 的 ， 再 返回 到 顶点 D， 此 时 还 有 三 条 
EREN, 一 条 条 来 ; T G 走 过 了 ，I， 哦 ， 这 是 一 个 新 顶点 ， 

没有 标记 ， 赶快 记 下 来 。 继 续 返 回 ， 直 到 返回 顶点 A， 确 认 你 已 经 完成 
遍历 任务 ， 0 





反应 快 的 同学 一 定 会 感觉 到 ， 深 度 优 移 过 历 其 实 就 是 一 个 递归 的 过 程 ， 
如 果 再 敏感 一 些 ， 会 发 现 其 实 转换 成 如 图 7-5-2 的 右 图 后 ， 就 像 是 一 株 树 
KITE, bh, Eat. EMAAR, DiC, 
然后 从 v 的 未 被 访问 的 邻接 点 出 发 深度 优先 遍历 图 ， 直 至 图 中 所 有 和 v 有 
路 径 相 通 的 顶点 都 被 访问 到 。 事 实 上 ， 我 们 这 里 讲 到 的 是 连通 图 ， 对 于 
非 连通 图 ， 只 需要 对 筷 的 连通 分 量 分别 进 行 深度 优先 遇 历 ， 即 在 先前 一 
个 顶点 进 行 一 次 深度 优先 遇 历 后 ， 辱 图 中 尚 有 顶点 未 被 访问 ， 则 为 选 图 
中 一 个 未 曾 被 访问 的 顶点 作 起 始点 ， 重 复 上 述 过 程 ， 直 至 图 中 所 有 顶点 
都 被 访问 到 为 止 。 











如 采 我 们 用 的 是 邻接 矩阵 的 方式 ， 则 代码 如 下 : 














/* Boolean 是 布尔 类 型 ， 其 值 是 TRUE 或 FALSE */ 
typedef int Boolean; 

/* 访问 标志 的 数组 */ 

Boolean visited[MAX]; 

/* ABBE MITE ACIS */ 

void DFS(MGraph G, int i) 

{ 








TUNNE ake 

visited[i] = TRUE; 

/* 打印 项 点， 也 可 以 其 他 操作 */ 

Digan Gp We GexS [ll 

woe G S OR S CIES j++) 

if (G.arc[i][j] == 1 && Eee tag la 

/* 对 为 访问 的 邻接 顶点 递归 调用 * 
DFS(G, j); 





























} 
/* 邻接 矩阵 的 深度 遍历 操作 */ 
Vo1d DFSTraverse(MGraph G) 
























































{ . . 
aiae ake 
for (i = 0; i < G.numVertexes; i++) 
/* 初始 所 有 顶点 状态 都 是 未 访问 过 状态 */ 
visited[i] = FALSE; 
for (i = 0; i < G.numVertexes; i++) 
/* 对 未 访问 过 的 顶点 调用 DFS， 若 是 连通 图 ， 只 会 执行 一 次 */ 
if (!visited[i]) 
DFS(G, i); 
} 





代码 的 执行 过 程 ， 其 实 就 是 我 们 刚才 迷宫 找寻 所 有 顶点 的 过 程 。 


如 果 图 结构 是 邻接 表 结 构 ， 其 DFSTraverse 函 数 的 代码 是 几乎 相同 的 ， 
只 是 在 递归 函数 中 因为 将 数组 换 成 了 链表 而 有 不 同 ， 代码 如 下 。 





/* 邻接 表 的 深度 优先 递归 算法 */ 
void DFS(GraphAdjList GL, int i) 
{ 





EdgeNode *p; 

visited[i] = TRUE; 

/* 打印 项 点， 也 可 以 其 他 操作 */ 
Pranth eo Gead] Lis ta edat al): 
p = GL->adjList[i].firstedge; 

while (p) 


if (!visited[p->adjvex] ) 
/* 对 为 访问 的 邻接 顶点 递归 调 
DFS(GL, p->adjvex); 

p = p->next; 
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} 


上 
/* 邻接 表 的 深度 遍历 操作 */ 
void DFSTraverse(GraphAdjList GL) 


ime abe 
for (i = 0; 1 < GL->numVertexes; i++) 
/* 初始 所 有 项 点 状态 都 是 未 访问 过 状态 */ 
visited[i] = FALSE: 
for (i = 0; i < GL->numVertexes; i++) 
/* 对 未 访问 过 的 顶点 调用 DFS， 若 是 连通 图 ， 只 会 执行 一 次 */ 
if (!visited[i]) 
DFS(GL, i); 
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中 的 所 有 元 素 , 因 此 都 需 要 0(m 





2) 的 时 间 。 而 邻接 表 做 存储 结构 时 ， 找 邻接 点 所 需 的 时 间 取 决 于 顶点 和 
边 的 数量 ， 所 以 是 Onte)。 显 然 对 于 点 多 边 少 的 稀 琉 图 来 说 ， 邻 接 表 结 
构 使 得 算法 在 时 间 效 率 上 大 大 提高 。 








对 于 有 疝 图 而 言 ， 由 于 它 只 是 对 通道 存在 可 行 或 不 可 行 ， 算 法 上 没有 变 
化 ， 是 完全 可 以 通用 的 。 这 里 就 不 再 详 述 了 。 


7.5.2 广度 优先 遍历 


广度 优先 裔 历 (Breadth_First_Search) ， 义 称 为 广度 优先 搜索 ， 简 称 

BFS。 还 是 以 找 钥匙 的 例子 为 例 。 小 孩子 不 太 可 能 把 钥匙 于 到 大 衣柜 顶 
上 或 厨房 的 油烟 机 里 去 ， 深 度 优先 遍历 意味 着 要 彻底 查找 完 一 个 房间 才 
查找 下 一 个 房间 ， 这 未 必 是 最 佳 方案 。 所 以 不 妨 先 把 家 里 的 所 有 房间 简 
单 看 一 再 ， 看 看 钥匙 是 不 是 就 放 在 很 显眼 的 位 置 ， 如 果 全 走 一 过 没有 ， 
再 把 小 孩 在 每 个 房间 玩 得 最 多 的 地 方 或 各 个 家 俱 的 下 面 找 一 找 ， 如 果 还 
是 没有 ， 那 看 一 下 每 个 房间 的 抽 敢 ， 这 样 一 步 步 扩 大 碍 找 的 范围 ， 直 到 
人 
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类 似 于 树 的 层 序 遍历 了 。 我 们 将 图 7-5-3 的 第 一 幅 图 稍微 变形 ， 变 形 原 则 
是 顶点 A 放置 在 最 上 第 一 层 ， 让 与 它 有 边 的 顶点 B、F 为 第 二 层 ， 再 让 与 
B 和 F 有 边 的 顶点 C、I、G、E 为 第 三 层 ， 再 将 这 四 个 顶点 有 边 的 D、H 放 
在 第 四 层 ， 如 图 7-5-3 的 第 二 幅 图 所 示 。 此 时 在 视觉 上 感觉 图 的 形状 发 生 
了 变化 ， 其 实 顶 点 和 边 的 关系 还 是 完全 相同 的 。 
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图 7-5-3 





有 了 这 个 讲解 ， 我 们 来 看 代码 就 非常 容易 了 。 以 下 是 邻接 矩阵 结构 的 广 
度 优先 遍历 算法 。 





/* 邻接 矩阵 的 广度 遍历 算法 */ 
void BFSTraverse(MGraph G) 





































































































{ . . . 
ale al y 
Queue Q; 
for (i = 0; i < G.numVertexes; i++) 
visited[i] = FALSE; 
/* 初始 化 一 辅助 用 的 队列 */ 
InitQueue(&Q ) / 
/* 对 每 一 个 顶点 做 循环 */ 
for (i = 0; i < G.numVertexes; i++) 
/* 若是 未 访问 过 就 处 理 */ 
ii CVvisirtedpi 
{ 
/* 设置 当前 顶点 访问 过 */ 
visited[i]=TRUE; 
/* 打印 顶点 ， 也 可 以 其 他 操作 */ 
prantine a5 GV eXS | 
/* 将 此 顶点 入 队列 */ 
EnQueue(&Q, i); 
/* 若 当 前 队列 不 为 空 */ 
while (!QueueEmpty(Q) ) 
{ 
/* 将 队 中 元 素 出 队列 ， 赋 值 给 二 */ 
DeQueue(&Q, &i); 
for (j = 0; j < G.numVertexes; j++) 
/* 判断 其 他 顶点 若 与 当前 顶点 存在 边 且 未 访问 过 */ 
if (G.arc[i][j] == 1 && !visited[j]) 
{ 
/* 将 找到 的 此 顶点 标记 为 已 访问 */ 
visited[j]=TRUE; 
/* 打印 顶点 */ 
print aC %c a GHvVexSle ]A 
/* 将 找到 的 此 顶点 入 队列 */ 
EnQueue(&Q, j); 
i 
} 
} 
} 
} 


对 于 邻接 表 的 三 度 优先 志 历 ， 代 码 与 邻接 矩阵 差异 不 大 ， 代 码 如 下 。 





/* 邻接 表 的 广度 遍历 算法 */ 
void BFSTraverse(GraphAdjList GL) 
{ 


ine i: 

EdgeNode *p; 

Queue Q; 

for (i = 0; i < GL->numVertexes; i++) 
visited[i] = FALSE; 


InitQueue(&Q); 
for (i = 0; i < GL->numVertexes; i++) 
{ 


if (!visited[i]) 


visited[i] = TRUE; 
/* 打印 顶点 ， 也 可 以 其 他 操作 */ 
printf("%c ", GL->ad]List [1] data); 





EnQueue(&Q, i); 

while (!QueueEmpty(Q) ) 

{ 
DeQueue(&Q, &i); 
/* 找到 当前 顶点 边 表 链 表 头 指针 */ 
D = GL->adjList[i].firstedge; 
while (p) 
{ 


/* 若 此 顶点 未 被 访问 */ 
if (!visited[p->adjvex] ) 


visited[p->adjvex] = TRUE; 

printf("%c ", GL->adjList[p->adjvex].data); 
/* 将 此 顶点 入 队列 */ 

EnQueue(&Q, p->adjvex); 


} 
/* 指针 指向 下 一 个 邻接 点 */ 
D = p->next; 
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杂 度 上 是 一 样 的 ， 不 同 之 处 仅仅 在 于 对 顶点 访问 的 顺序 不 同 。 可 见 两 者 
在 全 图 遍历 上 是 没有 优 劣 之 分 的 ， 只 是 视 不 同 的 情况 选择 不 同 的 算法 。 








不 过 如 果 图 顶点 和 边 非 党 多 ， 不 能 在 短 时 间 内 壳 历 完成 ， 遍 有 历 的 目的 是 
为 了 寻找 合适 的 项 把 ， 那 么 选择 哪 种 过 历 束 要 仔细 振 酌 了。 深度 优先 更 
适合 目标 比较 明确 ， 以 找到 目标 为 主要 目的 的 情况 ， 而 广度 优先 更 适合 
在 不 断 扩大 遍历 范围 时 找到 相对 最 优 解 的 情况 。 


这 里 还 要 再 多 说 几 负 ， 对 于 深度 和 广度 而 言 ， 已 经 不 是 简单 的 算法 实现 
问题 ， 完 全 可 以 上 升 到 方法 论 的 角度 。 你 求学 是 博览 群 书 、 不 求 甚 解 ， 
还 是 深 钴 细 研 、 睦 辟 入 里 ， 你 旅游 是 走马 观 伦 、 晴 虹 点 水 ， 还 是 下 马 看 





化、 深度 体验 ， 你 交友 是 四 海 之 内 丝 兄 第 ， 还 是 人 生得 一 知己 足 居 .….…… 
其 实 都 无 对 错 之 分 ， 只 视 不 同人 的 理解 而 有 了 不 同 的 诠释 。 我 个 人 觉得 
深度 和 广度 是 既 了 矛盾 义 统一 的 两 个 方面 ， 偏 占 都 不 可 取 ， 还 望 大 家 自己 


慢 慢 体 会 。 





7.6 最小 生成 村 





假设 你 是 电信 的 实施 工程 师 ， 需 要 为 一 个 镇 的 九 个 村 庄 架 设 通信 网 络 做 
设计 ， 村 庄 位 置 大 致 如 图 7-6-1， 其 中 vo 一 vs 是 村 庄 ， 之 间 连 线 的 数字 表 
示 村 与 村 间 的 可 通达 的 直线 距离 ， 比 如 vo 至 vi 就 是 10 公 里 《个 别 如 vo 与 
Vg? Ve INe Vc 与 Vy 未 测算 距离 是 因为 有 高 山 或 湖泊 ， 不 予 考 虑 ) 。 你 
们 领导 要 求 你 必须 用 最 小 的 成 本 完成 这 次 任务 。 你 说 怎么 办 ? 


KN 

















图 7-6-1 


显然 这 是 一 个 带 权 值 的 图 ， 即 网 结构 。 所 谓 的 最 小 成 本 ， 就 是 n 个 顶 
扩 ， 用 n-1 条 边 把 一 个 连通 图 连接 起 来 ， 并 且 使 得 权 值 的 和 最 小 。 在 这 
个 例子 里 ， 每 多 一 公里 就 多 一 份 成 本 ， 所 以 只 要 让 线路 连 线 的 公里 数 最 
D, WERDE Io 


如 果 你 加 班 加 点 ， 没 日 没 夜 设计 出 的 结果 是 如 图 7-6-2 的 方案 一 ( 粗 线 为 
要 染 设 线路 ) ， 我 想 你 离 被 炒 鳄 鱼 应 该 是 不 远 了 同学 微笑 ) 。 因 为 这 
个 方案 比 后 两 个 方案 多 出 60% 的 成 本 会 让 老板 气 野 过 去 的 。 














方案 一 方案 二 
公里 数 =11+26+20+22+18+21+24+19=161 。 公里 数 =8+12+10+11+17+19+16+7=100 
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方 案 ご 
公里 数 =8+12+10+11+16+19+16+7=99 


图 7-6-2 





方案 三 设计 得 非常 巧妙 ， 但 也 只 以 极其 微弱 的 优势 对 方案 二 胜出 ， 应 该 
说 很 是 侥 季 。 我 们 有 没有 办 法 可 以 精确 计算 出 这 种 网 图 的 最 佳 方案 呢 ? 
答案 当然 是 Yes。 


我 们 在 讲 图 的 定义 和 术语 时 ， 曾 经 提 到 过 ， 一 个 连通 图 的 生成 树 是 一 个 
极 小 的 连通 子 图 ， 它 含有 图 中 全 部 的 顶点 ， 但 只 有 足以 构成 一 棵 树 的 m- 
1 条 边 。 显 然 图 7-6-2 的 三 个 方案 都 是 图 7-6-1 的 网 图 的 生成 树 。 那 么 我 们 
把 构造 连通 网 的 最 小 代价 生成 树 称 为 最 小 生成 树 (Minimum Cost 
SpanningTree) 。 
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算法 。 我 们 就 分 别 来 介绍 一 下 。 


7.6.1 普 里 姆 (Prim) 算法 


为 了 能 讲 明白 这 个 算法 ， 我 们 先 构 造 图 7-6-1 的 邻接 矩阵， 如 图 7-6-3 的 
右 图 所 示 。 
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图 7-6-3 


也 束 是 说 ， 现 在 我 们 已 经 有 了 一 个 存储 结构 为 MGragh 的 G( 见 本 书 7.4 
节 邻 接 和 矩阵 ) 。G 有 9 个 顶点 ， 它 的 arc 二 维 数组 如 图 7-6-3 的 右 图 所 示 。 
数组 中 的 我 们 用 65535 来 代表 oo。 


于 是 普 里 姆 (Prim) 算法 代码 如 下 ， 左 侧 数字 为 行 号 。 其 中 INFINITY 
为 权 值 极 大 值 ， 不 妨 是 65535，MAXVEX 为 顶点 个 数 最 大 值 ， 此 处 大 于 
等 于 9 即 可 。 现 在 假设 我 们 上 自己 就 是 计算 机 ， 在 调用 MiniSpanTree_Prim 
输入 上 述 的 邻接 无 阵 后 ， 看 看 它 是 如 何 运 行 并 打印 出 最 小 生成 树 

















/* Prim 算 法 生成 最 小 生成 树 */ 
Vo1d MiniSpanTree_Prim(MGraph G) 








aie (bua. abe a} ee 

/* 保存 相关 顶点 下 标 */ 

int adjvex[MAXVEX]; 

/* 保存 相关 顶点 间 边 的 权 值 */ 

int lowcost[MAXVEX]; 

/* 初始 化 第 一 个 权 值 为 9， 即 ve 加 入 生成 树 */ 
/* lowcost 的 值 为 0， 在 这 里 就 是 此 下 标的 顶点 已 经 加 入 生成 树 */ 
lowcost[0] = 0; 

/* 初始 化 第 一 个 顶点 下 标 为 9 */ 
adjvex[0] = 0; 

if 循环 除 下 标 为 6 外 的 全 部 顶点 74 


for (i = 1; i < G.numVertexes; i++) 







































































/* 将 vg 顶点 与 之 有 边 的 权 值 存 入 数组 */ 
lowcost[i] = G.arc[0][i]; 

/* 初始 化 都 为 vg 的 下 标 */ 

adjvex[i] = 0; 














for (i = 1; i < G.numVertexes; i++) 


/* 初始 化 最 小 权 值 为 o， */ 

/* 通常 设置 为 不 可 能 的 大 数字 如 32767、65535 等 */ 
min = INFINITY; 

j=1; k=0; 

UP 循环 全 部 顶点 97/ 

while (] < G.numVertexes) 









































/* 如 果 权 值 不 为 9 且 权 值 小 于 min */ 
if (lowcost[j] != 0 && lowcost[j] < min) 

















{ 
/* 则 让 当前 权 值 成 为 最 小 值 */ 
min = lowcost[j]; 
/* 将 当前 最 小 值 的 下 标 存 入 k */ 
Ke = 

} 

lu 


} 

/* 打印 当前 顶点 边 中 权 值 最 小 边 */ 
printf("(%d,%d)", adjvex[k], K); 

/* 将 当前 顶点 的 权 值 设 置 为 9， 表示 此 顶点 已 经 完成 任务 */ 
lowcost[k] = 0; 

/* 循环 所 有 顶点 */ 


for (j = 1; j < G.numVertexes; j++) 



































/* 若 下 标 为 k 顶 点 各 边 权 值 小 于 此 前 这 些 顶 点 未 被 加 入 生成 树 权 值 */ 
if (lowcost[j] != 0 && G.arc[k][j] < lowcost[j]) 





/* 将 较 小 权 值 存 入 lowcost */ 
lowcost[j] = G.arc[k][j]; 

/* 将 下 标 为 k 的 顶点 存 入 adjvex */ 
adjvex[j] = k; 

+ 
} 
+ 
+ 


1. 程序 开始 运行 ， 我 们 由 第 4 一 5 行 ， 创 建 了 两 个 一 维 数组 lowcost 和 
adjvex， 长 度 都 为 顶点 个 数 9。 它 们 的 作用 我 们 慢 慢 细 说 。 


2. 第 6 一 7 行 我 们 分 别 给 这 两 个 数组 的 第 一 个 下 标 位 赋值 为 0， 
adjvex[0]=0 其 实意 思 就 是 我 们 现在 从 顶点 vo 开始 (事实 上 ， 最 小 生成 树 
从 哪个 顶点 开始 计算 都 无 所 谓 ， 我 们 假定 从 vo 开始 〉，1lowcost[0]=0 整 
表示 Vo 已 经 被 纳入 到 最 小 生成 树 中 ， 之 后 凡是 lowcost 数 组 中 的 值 被 设置 
为 0 就 是 表示 此 下 标的 顶点 被 纳入 最 小 生成 树 。 











3. 第 8 一 12 行 表示 我 们 读 取 图 7-6-3 的 右 图 邻接 矩阵 的 第 一 行 数据 。 将 数 
值 赋值 给 lowcost 数 组 ， 所 以 此 时 ]owcost 数 组 值 为 
{0,10,65535,65535,65535,11,65535,65535,65535}, 而 adjvex 则 全 部 为 0。 
此 时 ， 我 们 已 经 完成 了 整个 初始 化 的 工作 ， 准 备 开始 生成 。 





4. 第 13 一 36 行 ， 整 个 循环 过 程 就 是 构造 最 小 生成 树 的 过 程 。 


5. 第 15 一 16 行 ， 将 min 设 置 为 了 一 个 极 大 值 65535， 它 的 目的 是 为 了 之 
后 找到 一 定 范围 内 的 最 小 权 值 。j 是 用 来 做 顶点 下 标 循环 的 变量 ，k 是 用 
来 存储 最 小 权 值 的 顶点 下 标 。 





6. 第 17 一 25 行 ， 循 环 中 不 断 修 改 min 为 当前 lowcost 数 组 中 最 小 值 ， 并 用 
k 保 留 此 最 小 值 的 顶点 下 标 。 经 过 循环 后 ，min=10，k=1。 注 意 19 行 if 判 
断 的 lowcost[j]!=0 表 示 已 经 是 生成 树 的 顶点 不 参与 最 小 权 值 的 查找 。 


7. 第 26 行 ， 因 k=1，adjvex[1]=0， 所 以 打印 结果 为 (0,1)， 表 示 vo 人 至 V1 边 
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图 7-6-4 


8. 第 27 行 
J> 此 时 因 k= À 
=1 我 们 将 
我 们 将 lowcost[k]=0 就 是 说 顶点 v 引 生 
LV ANA Bile) 


成 树 中 。 此 时 lowcost 数 组 值 为 
{0,0,65535,65535,65535,11,65535,65535,65535}. 


9. 第 28 一 35 行 , j 循 東 由 1 公 8, 因 k=1, TIRARE REN BATHE 

权 值 ， 与 low-cost 的 对 应 值 比较 ， 若 更 小 则 修改 low-cost 值 ， 并 将 k 值 存 

入 adjvex 数 组 中 。 因 第 w 行 有 18、16、12 均 比 65535 小 ， 所 以 最 终 lowcost 
数组 的 值 为 : {0,0,18,65535,65535,11,16,65535,12}。adjvex 数 组 的 值 为 : 

{0,0,10,0,0,10,1}。 这 里 第 30 行 这 判断 的 lowcost[j]!=0 也 说 明 vo 和 Vi 已 经 

是 生成 树 的 顶点 不 参与 最 小 权 值 的 比 对 了 。10. 再 次 循环 ， 由 第 15 行 到 
第 26 行 ， 此 时 min=11，k=5，adjvex[5]=0。 因 此 打印 结构 为 (0,5)。 表 示 

v0 至 ve 边 为 最 小 生成 树 的 第 二 条 边 ， 如 图 7-6-5 所 示 。 


VC 


图 7-6-5 


11. 接 下 来 执行 到 36 行 ，lowcost 数 组 的 值 为 : 
{0,0,18,65535,26,0,16,65535,12}。ad-jvex 数 组 的 值 为 : 
{0,0,1,0,5,0,1,0,1}。12. 之 后 ， 相 信 大 家 也 都 会 自己 去 模拟 了 。 通 过 不 
断 的 转换 ， 构 造 的 过 程 如 图 7-6-6 中 图 1 一 图 6 所 示 。 
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图 7-6-6 


有 了 这 伴 的 讲解， 再 来 介绍 普 里 姆 (Prim 算法 的 实现 定义 可 能 就 容易 
理解 一 些 。 


假设 N=(V,{Ej) 是 连通 网 ，TE 是 N 上 最 小 生成 树 中 边 的 集合 。 算 法 从 U= 
{fuoj(uoEV)，TE={} 开 始 。 重 复 执行 下 述 操作 : 在 所 有 uEUvEV-U 的 
边 (u,v) EE 中 找 一 条 代价 最 小 的 边 (uo,vo) 并 入 集合 TE， 同 时 vo 并 入 U， 直 
ae 此 时 TE 中 必 有 n-1 条 边 ， 则 T=(V,{TE}) 为 N 的 最 小 生成 

对 。 


由 算法 代码 中 的 循环 嵌 套 可 得 知 此 算法 的 时 间 复 杂 度 为 Do)。 


7.6.2 W&F (Kruskal) 算法 


现在 我 们 来 换 一 种 思考 方式 ， 普 里 姆 Prim) 算法 是 以 茶 顶 点 为 起 点 ， 

逐步 找 各 顶点 上 最 小 权 值 的 边 来 构建 最 小 生成 树 的 。 这 惑 像 是 我 们 如 果 
去 参观 东 个 展会 ， 例 如 世博 会 ， 你 从 一 个 入 口 进 去 ， 然 后 找 你 所 在 位 置 
周边 的 场馆 中 你 最 感 兴趣 的 场馆 观光 ， 看 完 后 再 用 同样 的 办 法 看 下 一 

个 。 可 我 们 为 什么 不 事先 计划 好 ， 进 园 后 直接 到 你 最 想 去 的 场馆 观看 

呢 ? 事实 上 ， 去 世博 园 的 观众 ， 绝 大 多 数 都 是 这 样 做 的 。 


同样 的 思路 ， 我 们 也 可 以 直接 就 以 边 为 目标 去 构建 ， 因 为 权 值 是 在 边 
上 ， 直 接 去 找 最 小 权 值 的 边 来 构建 生成 树 也 是 很 自然 的 想法 ， 只 不 过 构 
建 时 要 考虑 是 否 会 形成 环 路 而 已 。 此 时 我 们 就 用 到 了 图 的 存储 结构 中 的 
边 集 数 组 结构 。 以 下 是 edge 边 集 数组 结构 的 定义 代码 : 


/* 对 边 集 数组 Edge 结 构 的 定义 */ 
typedef struct 
{ 





int begin; 

int end; 

int weight; 
} Edge; 


我 们 将 图 7-6-3 的 邻接 矩阵 通过 程序 转化 为 图 7-6-7 的 右 图 的 边 集 数组 ， 
并 且 对 它们 按 权 值 从 小 到 大 排序 。 
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图 7-6-7 


于 是 元 鲁 斯 卡尔 (Kruskal) 算法 代码 如 下 ， 左 侧 数 字 为 行 号 。 其 中 
MAXEDGE 为 边 数量 的 极 大 值 ， 此 处 大 于 等 于 15 即 可 ，MAXVEX 为 顶 











点 个 数 最 大 值 ， 此 处 大 于 等 于 9 即 可 。 现 在 假设 我 们 自己 就 是 计算 机 ， 
在 调用 MiniSpanTree_Kruskal 函 数 ， 输 入 图 7-6-3 右 图 的 邻接 矩阵 后 ， 看 
看 它 是 如 何 运 行 并 打印 出 最 小 生成 树 的 。 





/* Kruskal 算 法 生成 最 小 生成 树 */ 
/* 生成 最 小 生成 树 */ 
void MiniSpanTree_Kruskal(MGraph G) 














alae: ab Ts te 
/* 定义 边 集 数组 */ 
Edge edges[MAXEDGE]; 
/* 定义 一 数组 用 来 判断 边 与 边 是 否 形 成 环 路 */ 
int parent[MAXVEX] / 
/* 此 处 省 上 略 将 令 接 矩 阵 6 转化 为 边 集 数组 edges 
按 权 由 小 到 大 排序 的 代码 */ 
for (i = 0; i < G.numVertexes; i++) 
/* 初始 化 数组 值 为 9 */ 
parent[i] = 0; 
/* ITIR RIL */ 


for (i = 0; i < G.numEdges; i++) 








= 

































































n Find(parent, edges[i].begin) ; 
Find(parent, edges[i].end); 
> 假如 n 与 m 不 等 ， 说 明 此 边 没 有 与 现 有 生成 树 形成 环 路 */ 


if (n != m) 


{ 




















从 a Sy 
/* 表示 此 顶点 已 经 在 生成 树 集合 中 
parent[n] = m; 
printf("(%d, %d) %d ", edges[1] .begin, 
edges[1] .end, edges[i].weight); 

















} 
} 


+ 
/* 查找 连 线 顶 点 的 尾部 下 标 */ 


int Find(int *parent, int f) 


while (parent[f] > 0) 
f = parent[f]; 
return f; 





1. 程 序 井 始 迄 行 , 第 5 行 之 后 , RATA Pe h f AV RAS SOW 
将 邻接 矩阵 转换 为 边 集 数组 ， 并 按 权 值 从 小 到 大 排序 的 代码 ， 也 就 是 

说 ， 在 第 5 行 开 始 ， 我 们 已 经 有 了 结构 为 edge， 数 据 内 容 是 图 7-6-7 的 右 
图 的 一 维 数组 edges 。 


2. 第 5 一 7 行 ， 我 们 声明 一 个 数组 parent， 并 将 它 的 值 都 初始 化 为 0， 它 
的 作用 我 们 后 面 慢 慢 说 。 


3. 第 8 一 17 行 ， 我 们 开始 对 边 集 数组 做 循环 遍历 ， 开 始 时 ，i=0。 


4. 第 10 行 ， 我 们 调用 了 第 19 一 25 行 的 函数 Find， 传 入 的 参数 是 数组 
parent 和 当前 权 值 最 小 边 (vy,v7) 的 begin:4。 因 为 parent 中 全 都 是 0 所 以 传 出 
值 使 得 n=4。 


5. 第 11 行 ， 同 样 作 法 ， 传 入 (vy,v7) 的 end:7。 传 出 值 使 得 m=7。 


6. 第 12 一 16 行 ， 很 显然 n 与 m 不 相等 ， 因 此 parent[4]=7。 此 时 parent 数 组 
值 为 {0,0,0,0,7,0,0,0,0}， 并 且 打 印 得 到 “(4,7)7”。 此 时 我 们 已 经 将 边 
(VsV7) 纳 入 到 最 小 生成 树 中 ， 如 图 7-6-8 所 示 。 





图 7-6-8 


7. 循环 返回 ， 执 行 10 一 16 行 ， 此 时 i=1，edge[1] 得 到 边 (v,va)，n=2， 
m=8，par-ent[2]=8， 打 印 结果 为 “(2,8)8”， 此 时 parent 数 组 值 为 
{0,0,8,0,7,0,0,0,0}， 这 也 就 表示 边 (vy,v7) 和 边 (v>,ve) 已 经 纳入 到 最 小 生成 
树 ， 如 图 7-6-9 所 示 。 


VTC 


图 7-6-9 


8. 再 次 执行 10 一 16 行 ， 此 时 计 2，edge[2] 得 到 边 (vouvi)，n=0，m=1， 
parent[0]=1， 打 印 结果 为 “(0,1)10”， 此 时 parent 数 组 值 为 
{1,0,8,0,7,0,0,0,0}， 此 时 边 (vy,vy)、(V2yV8) 和 (V0,V1) 已 经 纳入 到 最 小 生成 
树 ， 如 图 7-6-10 所 示 。 


ヤ て 


図 7-6-10 


9. 当 ij=3。 4s 5、 6 时 ， TAKA (Vo Vs) (Vi Vg) (V3,V7)、 (vive) 纳 入 到 
最 小 生成 树 中 ， 如 图 7-6-11 所 示 。 此 时 parent 数 组 值 为 
{1,5,8,7,7,8,0,0,6}， 怎 么 去 解读 这 个 数组 现在 这 些 数 字 的 意义 呢 ? 





i=5 i=6 


图 7-6-11 


从 图 7-6-11 的 右 下 方 的 图 =6 的 粗 线 连 线 可 以 得 到 ， 我 们 其 实 是 有 两 个 连 


通 的 边 集合 A 与 B 中 纳入 到 最 小 生成 树 中 的 ， 如 图 7-6-12 所 示 。 当 
parent[0]=1， 表 示 vo 和 vi 已 经 在 生成 树 的 边 集合 A 中 。 此 时 将 parent[0]=1 
的 1 改 为 下 标 ， 由 par-ent[1]=5， 表 示 V1 和 vs 在 边 集 合 A 中 ，par-ent[5]=8 表 
示 Vs 与 Vg 在 边 集合 A 中 ，par-ent[8]=6 表 示 vg 与 Ve 在 边 集合 A 中 ，par- 
ent[6]=0 表 示人 集合 A 和 暂时 到 头 ， 此 时 边 集合 A 有 vo、Vvi、vVv5、vVvs、v6。 我 
们 和 查看 parent 中 没有 得 看 的 值 ，parent[2]=8 表 示 Vv" 与 ve 在 一 个 集合 中 ， 
此 v。 也 在 辺 集合 A 中 。 再 由 parent[3]=7、par-ent[4]=7 和 parent[7]=0 可 知 
V3、V4、Vy 在 男 一 个 边 集 合 B 中 。 








此 结合 人 
Hs: 


图 7-6-12 


10. 当 i=7 时 ， 第 10 行 ， 调 用 Find 函 数 ， 会 传 入 参数 edges[7].begin=5。 此 
时 第 21 行 ，parent[5]=8>0， 所 以 f=8， 再 循环 得 par-ent[8]=6。 
parent[6]=0 所 以 Find 返 回 后 第 10 行 得 到 n=6。 而 此 时 第 11 行 ， 传 入 参数 
edges[7].end=6 得 到 m=6。 此 时 n=m， 个 再 打印 ， 继 续 下 一 循环 。 这 束 告 
诉 我 们 ， 因 为 边 (vs,ve) 使 得 边 集 合 A 形成 了 环 路 。 因 此 不 能 将 它 纳 入 到 
最 小 生成 树 中 ， 如 图 7-6-12 所 示 。11. 当 i=8 时 ， 与 上 面相 同 ， 由 于 边 


(Vj,V>) 使 得 边 集 合 A 形 成 了 环 路 。 因 此 不 能 将 它 纳 入 到 最 小 生成 树 中 ， 

如 图 7-6-12 所 示 。12. 当 i=9 时 ， 边 (ve,vy)， 第 10 行 得 到 n=6， 第 11 行 得 
到 m=7， 因 此 parent[6]=7， 打 印 “(6,7)19”。 此 时 parent 数 组 值 为 
{1,5,8,7,7,8,7,0,6}， 如 图 7-6-13 所 示 。13. 此 后 边 的 循环 均 造 成 环 路 ， 最 
终 最 小 生成 树 即 为 图 7-6-13 所 示 。 


图 7-6-13 


好 了 ， 我 们 来 把 克 鲁 斯 卡尔 (Kruskal) 算法 的 实现 定义 归纳 一 下 结束 这 
一 市 的 讲解 。 





假设 N=(V,{E}) 是 连通 网 ， 则 令 最 小 生成 树 的 初始 状态 为 只 有 n 个 顶点 而 
无 边 的 非 连 通 图 T={V,{}}， 图 中 每 个 顶点 自 成 一 个 连通 分 量 。 在 E 中 先 
择 代 价 最 小 的 边 ， 若 该 边 依附 的 项 点 落 在 T 中 不 同 的 连通 分 量 上 ， 则 将 
此 边 加 入 到 T 中 ， 香 则 售 去 此 边 而 选择 下 一 条 代价 最 小 的 边 。 依 次 类 
推 ， 直 至 T 中 所 有 顶点 都 在 同一 连通 分 量 上 为 止 。 











此 算法 的 Find 函 数 由 边 数 e 决 定 ， 时 间 复 杂 度 为 Oogej， 而 外 面 有 一 个 
for 循 环 e 次 。 所 以 融 鲁 斯 卡尔 算法 的 时 间 复 杂 度 为 O(eloge)。 





对 比 两 个 算法 ， 死 鲁 斯 卡尔 算法 主要 是 针对 边 来 展开 ， 边 数 少 时 效率 会 
非常 高 ， 所 以 对 于 稀 路 图 有 很 大 的 优势 ， 而 普 里 姆 算法 对 于 稠密 图 ， 即 
边 数 非常 多 的 情况 会 更 好 一 些 。 


7.7 “最短 路径 


我 们 时 第 会 面临 厦 对 路 径 选 择 的 决策 问题 。 例 如 在 北 奈 、 上 海 、 广 州 等 
城市 ， 因 其 城市 面积 较 大 ， 乘 地 铁 或 公交 都 要 考虑 从 A 扣 到 B 点 ， 如 何 
换 乘 到 达 ? 比如 图 7-7-1 这 样 的 地 铁 网 图 ， 如 果 不 是 专门 去 做 研究 ， 对 于 
刚 接触 的 人 来 说 ， 都 会 犯 迷 糊 。 


现实 中 ， 每 个 人 需求 不 同 ， 选 择 方 案 殊 不 尽 相 同 。 有 人 为 了 省 钱 ， 它 需 
要 的 是 路 程 最 短 (定价 以 路 程 长 短 为 标准 ) ， 但 可 能 由 于 线路 班次 少 ， 
换 乘 站 间距 离 长 等 原因 并 不 省 时 间 ; 而 另 一 些 人 ， 为 了 要 赶 飞 机 火车 或 
者 早晨 上 班 不 迟到 ， 他 最 大 的 需求 是 总 时 间 要 短 ; 还 有 一 类 人 ， 如 老人 
行动 不 便 ， 或 者 上 班 族 下 班 ， 忙 碌 一 天 累 得 要 死 ， 他 们 都 不 想 多 走路 ， 
哪怕 车 子 绕 远 路 耗 时 长 也 无 所 请 ， 关 键 是 换 乘 要 少 ， 这 样 可 以 在 车 上 好 
好 休息 一 下 《有些 线路 方案 换 乘 两 次 比 换 乘 三 四 次 耗 时 还 长 ) 。 这 些 都 
古老 百姓 的 需求 ， 简 单 的 图 形 可 以 徘 人 的 经 验 和 感觉 ， 但 复杂 的 道路 或 
地 铁 网 束 需 要 计算 机 通过 算法 计算 来 提供 最 佳 的 方案 。 我 们 今天 残 要 来 
研究 关于 图 的 最 短路 径 的 问题 。 
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图 7-7-1 


在 网 图 和 非 网 图 中 ， 最 短路 径 的 含义 是 不 同 的 。 由 于 非 网 图 它 没 有 边 上 
的 权 值 ， 所 谓 的 最 短路 径 ， 其 实 束 是 指 两 顶点 之 间 经 过 的 边 数 最 少 的 路 
径 ， 而 对 于 网 图 来 说 ， 最 短路 径 ， 是 指 两 顶点 之 间 经 过 的 边 上 权 值 之 和 
最 少 的 路 径 ， 并 且 我 们 称 路 径 上 的 第 一 个 顶点 是 源 点 ， 最 后 一 个 项 氮 是 
终点 。 显 然 ， 我 们 研究 网 图 更 有 实际 意义 ， 束 地 图 来 说 ， 距 离 就 是 两 顶 
人 OAI 
| 。 











我 们 要 讲解 两 种 求 最 短路 径 的 算法 。 先 来 讲 第 一 种 ， 从 某 个 源 点 到 其 余 
各 顶点 的 最 短路 径 问 题 。 


你 能 很 快 计 算出 图 7-7-2 中 由 源 点 vo 到 终点 ve 的 最 短路 径 吗 ? 如果 不能 , 
没关系 ， 我 们 一 同 来 研究 看 如 何 让 计算 机 计算 出 来 。 如 果 能 ， 哼 哼 ， 那 
仅 代 表 你 智商 还 不 错 ， 你 还 是 要 来 好 好 学 习 ， 毕 竟 真 实 世 界 的 图 可 没 这 
么 简单 ， 人 脑 是 用 来 创造 而 不 是 做 枯燥 复杂 的 计算 的 。 好 了 ， 我 们 开始 
吧 。 








a BP) 


7.7.1 迪 杰 斯 特 拉 (Dijkstra) 算法 


a E 它 的 思路 大 体 是 





比如 说 要 求 图 7-7-3 中 顶点 vo 到 顶点 v1 的 最 短 距离 ， 没 有 比 这 更 简单 的 
了 ， 管 案 就 是 1， 路 径 就 是 直接 vo 连 线 到 v1。 


\ J ん 
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7-7-3 


由 于 顶点 w 还 与 v、Vv3、V4 连 线 ， 所 以 此 时 我 们 同时 求 得 了 


Vo > V1 > V2=1+3=4, Vo っ Vi っ V3=1+7=8, Vn っ Vy っ V4 ニ 1+5=6。 


现在 ， 我 问 vo 到 v, 的 最 短 距 离 ， 如 果 你 不 假 思 索 地 说 是 5， 那 就 犯错 
了 。 因 为 边 上 都 有 权 值 ， 刚 才 已 经 有 vo Vi»V; 的 结果 是 4， 比 5 还 要 小 1 
个 单位 ， 它 才 是 最 短 距离 ， 如 图 7-7-4 所 示 。 








图 7-7-4 


由 于 顶点 v2 还 与 Va、vVs 连 线 ， 所 以 此 时 我 们 同时 求 得 了 vo 一 Vo 一 V4 其 实 
就 逢 v。 っ v」 っ っ v マ ー4+1=5, Vo= Vo oVe=4+7=11. 这 里 vs 多 我 们 用 的 
是 刚才 计算 出 来 的 较 小 的 4。 此 时 我 们 也 发 现 vo っ vV」 っ っ マー=5 要 比 
Vo 一 V1 一 V4=6 还 要 小 。 所 以 vo 到 v4 目前 的 最 小 距离 是 5， 如 图 7-7-5 所 示 。 





图 7-7-5 


当 我 们 要 求 vo 到 v3 的 最 短 距离 时 ， 通 向 v3 的 三 条 边 ， 除 了 ve 没有 研究 过 
外 , Vo 一 V1 一 V3 的 结果 是 8， 而 Vo 一 V4 一 V3=5+2=7。 因此 ， vo 到 V。 的 最短 
距离 是 7， 如 图 7-7-6 所 示 。 





图 7-7-6 


好 了 ， 我 想 你 大 致 明日 ， 这 个 迪 杰 斯 特 拉 〈Di-jkstra) 算法 是 如 何 干 活 
的 了 。 它 并 不 是 一 下 子 就 求 出 了 vo 到 vs 的 最 短路 径 ， 而 是 一 步 步 求 出 它 
们 之 间 项 点 的 最 短路 径 ， 过 程 中 都 是 基于 已 经 求 出 的 最 短路 径 的 基础 
上 ， 求 得 更 远 顶 点 的 最 短路 径 ， 最 终 得 到 你 要 的 结果 。 























如 果 还 是 不 太 明 白 ， 不 要 紧 ， 现 在 我 们 来 看 代码 ， 从 代码 的 模拟 运行 
中 ， 再 次 去 理解 它 的 思想 。 


#define MAXVEX 9 
#define INFINITY 65535 
typedef int 
/* 用 于 存储 最 短路 径 下 标的 数组 */ 
Patharc[MAXVEX] / 
typedef int 
/* 用 于 存储 到 各 点 最 短路 径 的 权 值 和 */ 
ShortPathTab1e [MAXVEX] ; 
/* Dijkstra 算 法 ， 求 有 向 网 6 的 vg 顶点 到 其 余 项 点 v 最 短路 径 P[v] 及 带 权 长 度 D[v] */ 
/* P[v] 的 值 为 前 驱 顶 点 下 标 ，D[v] 表 示 ve 到 v 的 最 短路 径 长 度 和 。 */ 
void ShortestPath_Dijkstra(MGraph G, int v0, 
Patharc *P, ShortPathTable *D) 
£ 












































Ine V W Kk min; 

/* final[w]=1 表 示 求 得 顶点 v9 至 vw 的 最 短路 径 */ 
int fina1 [MAXVEX] / 

/* 初始 化 数据 */ 

for (v = 0; v < G.numVertexes; V++ ) 


6 





/* 全 部 顶点 初始 化 为 未 知 最 短路 径 状 态 */ 
final[v] = 0; 

/* 将 与 vg 点 有 连 线 的 顶点 加 上 权 值 */ 
(*D)[v] = G.arc[vO][v]; 

/* 初始 化 路 径 数 组 P 为 -1 */ 

(MIN = 




















- Vv9 至 Vg 路 径 为 9 */ 

(*D)[v0] = ©; 

/* vg 至 Ve 不 需要 求 路 径 */ 

final[vo] = 1; 

/* 开始 主 循环 ， 每 次 求 得 vg 到 某 个 v 顶 点 的 最 短路 径 */ 
for (v = 1; v < G.numVertexes; V++ ) 


{ 








/* 当 前 所 知 高 Ve 項 点 的 最近 距 高 */ 
min=INFINITY; 

/* 寻找 离 vg 最 近 的 顶点 */ 

for (w = 0; w < G.numVertexes; W++ ) 


上 
if (!final[w] && (*D)[w] < min) 


k=w; 
/* Ww 顶点 离 vg 顶 点 更 近 */ 


min = (*D)[w]; 





is 

/* 将 目前 找到 的 最 近 的 顶点 置 为 1 */ 
final[k] = 1; 

/* 修正 当前 最 短路 径 及 距离 */ 

for (w = 0; w < G.numVertexes; W++ ) 

















{ 
/* 如 果 经 过 v 顶 点 的 路 径 比 现在 这 条 路 径 的 长 度 短 的 话 */ 
if (!final[w] && (min + G.arc[k][w] < (*D) [w] ) ) 
/* 说 明 找到 了 更 短 的 路 径 ， 修 改 D[w] 和 P[w] */ 
/* 修改 当前 路 径 长 度 */ 
(*D)[w] = min + G.arc[k][w]; 
(*P)[w]=k; 
ty 
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G， 如 图 7-7-7 的 右 图 ， 并 且 定 义 参 数 vo 为 0。 
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图 7-7-7 





1. 程序 开始 运行 ， 第 4 行 final 数 组 是 为 了 vo 到 某 顶 点 是 否 已 经 求 得 最 短 
路 径 的 标记 ， 如 果 vo 到 jv 已 经 有 结果 ， Wfi-nalfw]=1。 


2. 第 5 一 10 行 ， 是 在 对 数据 进行 初始 化 的 工作 。 此 时 final 数 组 值 均 为 
0， 表 示 所 有 的 点 都 未 求 得 最 短路 径 。D 数 组 为 
{65535,1,5,65535,65535,65535,65535,65535,65535}. [Al Avy Sv, Mv hid 
权 值 为 1 和 5。P 数 组 全 为 0， 表 示 目 前 没有 路 径 。 








3. 第 11 行 ， 表 示 vo 到 vo 自 身 ， 权 值 和 结果 为 0。D 数 组 为 
{0,1,5,65535,65535,65535,65535,65535,65535}。 第 12 行 ， 表 示 vo 点 算是 
已 经 求 得 最 短路 径 ， 因 此 final[0]=1。 此 时 final 数 组 为 
{1,0,0,0,0,0,0,0,0}。 此 时 整个 初始 化 工作 完成 。 





4. 第 13 一 33 行 ， 为 主 循环 ， 每 次 循环 求 得 vo 与 一 个 顶点 的 最 短路 径 。 
因此 v 从 1 而 不 是 0 开始 。 


5. 第 15 一 23 行 ， 先 令 min 为 65535 的 极 大 值 ， 通 过 w 循 环 ， 与 D[w] 比 较 
找到 最 小 值 min=1，k=1。 


6. 第 24 行 ， 由 k=1， 表 示 与 Vo 最 近 的 顶点 是 vj/， 并 且 由 D[1]=1， 知 道 此 
时 vo 到 vi 的 最 短 距离 是 1。 因 此 将 vi 对 应 的 final[1] 设 置 为 1。 此 时 final 数 
组 为 {1,1,0,0,0,0,0,0,0}。 








7. 第 25 一 32 行 是 一 循环 ， 此 循环 其 为 关键 。 它 的 目的 是 在 刚才 已 经 找 
到 vo 与 Vi 的 最 短路 径 的 基础 上 ， 对 vi 与 其 他 顶点 的 边 进行 计算 ， 得 到 v0 
与 它们 的 当前 最 短 距 离 ， 如 图 7-7-8 所 示 。 因 为 min=1， 上 所 以 本 来 
D[2]=5, 現在 vv」 っ vV っ =D[2]=min+3=4, vo っ vV」 っ Vs=D[3]=min+7=8, 
Vo? V1 > V4=D[4]=min+5=6, Alt, DH SAIN 





{0,1,4,8,6,65535,65535,65535,65535}. 面 P[2]=1, P[3]=1, P[4]=1, ER 
示 的 意思 是 vo 到 vv、va、vV4 点 的 最 短路 径 它 们 的 前 驱 均 是 vi 。 此 时 P 数 组 
值 为 : {0,0,1,1,1,0,0,0,0}。 








図 7-7-8 


8. 重新 开始 循环 ， 此 时 v=2。 第 15 一 23 行 ， 对 w 循 环 ， 注 意 因为 
final[0]=1 和 fi-nal[1]=1， 由 第 18 行 的 !final[w] 可 知 ，vo 与 Vi 并 不 参与 最 小 
值 的 获取 。 通 过 循环 比较 ， 找 到 最 小 值 min=4，k=2。 


9. 第 24 行 ， 由 k=2， 表 示 已 经 求 出 vo 到 v, 的 最 短路 径 ， 并 且 由 D[2]=4， 
知道 最 短 距离 是 4。 因 此 将 v; 对 应 的 final[2] 设 置 为 7， 此 时 final 数 组 为 : 
{1,1,1,0,0,0,0,0,0}。10. 第 25 一 32 行 。 在 刚才 已 经 找到 wu 与 vv 的 最 短路 
径 的 基础 上 ， 对 Vv 与 其 他 顶点 的 边 ， 进 行 计算 ， 得 到 v6 与 它们 的 当前 最 
短 距 离 ， 如 图 7-7-9 所 示 。 因 为 min=4， 所 以 本 来 D[4]=6， 现 在 

Vo > Vo > V4=D[4]=min+1=5, っ っ Vs=D[5]=min+7=11, 因此 ，D 数 组 
当前 值 为 ，{0,1,4,8,5,11,65535,65535,65535}。 而 原本 P[4]=1， 此 时 
P[4]=2，P[5]=2， 它 表示 vo 到 v4、vs 点 的 最 短路 径 它 们 的 前 驱 均 是 v。 此 
时 P 数 组 值 为 : {0,0,1,1,2,2,0,0,0}。 








Yy 


11. 重新 开始 循环 ， 此 时 v=3。 第 15 一 23 行 ， 通 过 对 w 循 环比 较 找 到 最 
小 值 min=5，k=4。12. 第 24 行 ， 由 k=4， 表 示 已 经 求 出 vo 到 vy 的 最 短路 
径 ， 并 且 由 D[4]=5， 知 道 最 短 距离 是 5。 因 此 将 vy 对 应 的 final[41 设 置 为 
1。 此 时 final 数 组 为 : {1,1,1,0,1,0,0,0,0}。13. 第 25 一 32 行 。 対 v。 与 其他 
顶点 的 边 进行 计算 ， 得 到 vo 与 它们 的 当前 最 短 距 离 ， 如 图 7-7-10 所 示 。 


图 7-7-9 





因为 min=5， 所 以 本 来 D[3]=8， 现 在 vo > v4 v3=D[3]=min+2=7, AK 
D[5]=11, 現在 vV。 っ v」 っ va=D[5]=min+3=8, 4 

っ vV4 っ Ve=D[6]=min+6=11, v9 > v4 > V7=D[7]=min+9=14, Alt, D 数 
组 当前 值 为 : {0,1,4,7,5,8,11,14,65535}。 而 原本 P[3]=1， 此 时 P[3]=4， 原 
本 P[5]=2， 此 时 P[5]=4， 男 外 P[6]=4，P[7]=4， 它 表示 vo 到 v3、vVs、vVe、 
Vy 点 的 最 短路 径 它 们 的 前 驱 均 是 vy。 此 时 P 数 组 值 为 : 
{0,0,1,4,2,4,4,4,0}. 





图 7-7-10 


14. 之 后 的 循环 就 完全 类 似 了 。 得 到 最 终 的 结果 ， 如 图 7-7-11 所 示 。 此 
时 final 数 组 为 ，{1,1,1,1,1,1,1,1,1}， 它 表示 所 有 的 顶点 均 完成 了 最 短路 
径 的 查找 工作 。 此 时 DD 数组 为 ，{0,1,4,7,5,8,10,12,16}， 它 表示 vo 到 各 个 
顶点 的 最 短路 径 数 ， 比 如 D[8]=1+3+1+2+3+2+4=16。 此 时 的 P 数 组 为 : 

{0,0,14,2,4,3,6,7}， 这 串 数 字 可 能 略为 难 理解 一 些 。 比 如 P[8]=7， 它 的 

意思 是 vo 到 vg 的 最 短路 径 ， 顶 点 ve 的 前 驱 顶 点 是 v3， 再 由 P[7]=6 表 示 v;y 的 
前 驱 是 ve，P[6]=3， 表 示 ve 的 前 驱 是 v8。 这样 就 可 以 得 到 ，vo 到 vg 的 最 短 
BRE AV, V7 Vg V Vy Vo HV, Vo 即 


V0 一 V1 一 V? 一 V4 一 V3 一 V6 一 V7 一 V8。 
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図 7-7-11 
其 实 最 终 返 回 的 数组 D 和 数组 P， 是 可 以 得 到 vo 到 任意 一 个 顶点 的 最 短路 
径 和 路 径 长 度 的 。 例 如 vo 到 vs 的 最 短路 径 并 没有 经 过 vs， 但 我 们 已 经 知 


道 vo 到 vs 的 最 短路 径 了 。 由 D[5]=8 可 知 它 的 路 径 长 度 为 8， 由 P[5]=4 可 知 


vs 的 前 驱 顶 点 是 v4， 所 以 vo 到 ve 的 最 短路 径 是 v0 一 V1 一 V2? 一 V4 一 V5。 


也 就 是 说 ， 我 们 通过 迪 杰 斯 特 拉 〈Dijkstra) 算法 解决 了 从 某 个 源 点 到 
其 余 各 项 点 的 最 短路 径 问 题 。 从 循环 峙 套 可 以 很 容易 得 到 此 算法 的 时 间 
复杂 度 为 Oo)， 尽 管 有 同学 觉得 ， 可 不 可 以 只 找到 从 源 点 到 某 一 个 特 
定 终点 的 最 短路 径 ， 其 实 这 个 问题 和 求 源 点 到 其 他 所 有 顶点 的 最 短路 径 
一 样 复杂 ， 时 间 复 杂 度 依然 是 O(n”)。 














这 就 好 比 ， 你 号 了 七 个 包子 终于 算是 吃 饮 了， 就 感觉 很 不 划算 ， 前 六 个 
包子 白 吃 了 ， 应 该 直接 吧 第 七 个 包子 ， 于 是 你 就 去 寻找 可 以 吃 一 个 就 能 
饱 肚子 的 包子 ， 能 够 满足 你 的 要 求 最 终结 果 只 能 有 一 个 ， 那 束 是 用 七 个 
包子 的 面粉 和 馅 做 的 一 个 大 包子 。 这 种 只 关注 结果 而 忽略 过 程 的 思想 是 
非常 不 可 取 的 。 


可 如 果 我 们 还 需要 知道 如 vs 到 vo、vj 到 vz 这 样 的 任 一 顶点 到 其 余 所 有 顶 
点 的 最 短路 径 怎 么 办 呢 ? 此 时 简单 的 办 法 就 是 对 每 个 顶点 当 作 源 点 运行 
一 次 迪 杰 斯 特 拉 (Dijkstra) 算法 ， 等 于 在 原 有 算法 的 基础 上 ， 再 来 一 
次 循环 ， 此 时 整个 算法 的 时 间 复 杂 度 就 成 了 O(nm3)。 











对 此 ， 我 们 现在 再 来 介绍 另 一 个 求 最 短路 径 的 算法 一 一 弗 洛 伊 德 
(Floyd) ， 它 求 所 有 顶点 到 所 有 项 点 的 时 间 复 杂 度 也 是 O(m)， 但 其 算 
法 非 第 简洁 优雅 ， 能 让 人 感觉 到 智 芒 的 无 限 魅力 。 好 了 ， 让 我 们 束 一 同 
来 欣赏 和 学 习 它 吧 。 





7.7.2 那 洛 伊 徳 (Floyd) 算法 


为 了 能 讲 明 白 弗 洛 伊 德 〈Floyd) 算法 的 精妙 所 在 ， 我 们 先 来 看 最 简单 
的 案例 。 疼 7-7-12 的 左 图 是 一 个 最 简单 的 3 个 项 点 连通 网 图 。 
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图 7-7-12 


我 们 先 定 义 两 个 二 维 数组 D[3][3] 和 了 P[3][3]，D 代 表 顶 点 到 顶点 的 最 短路 





TEASE A KEE © PRRI DM TTL FY foc BA EY BT SRE, 用 来 存 侍 路 
径 。 在 未 分 析 任 何 项 点 之 前 ， 我 们 将 D 命 名 为 D1， 其 实 它 就 是 初始 的 几 
的 邻接 和 矩阵。 将 P 命 名 为 P1， 初 始 化 为 图 中 所 示 的 矩阵 。 





首先 我 们 来 分 析 ， 所 有 的 顶点 经 过 vo 后 到 达 另 一 顶点 的 最 短路 径 。 因 为 
只 有 三 个 顶点 ， 因 此 需要 查看 v1 vo-V2， 得 到 D1[1][0]+D.1[0] 
[2]=2+1=3。D.1[1][2] 表 示 的 是 vi -V5 的 权 值 为 5， 我 们 发 现 D.1[1][2]>D. 
1[1][0]+D.1[0][2]， 通 俗 的 话 讲 就 是 vi > vo > vkb E ev, -V5 踊 离 还 要 
近 。 所 以 我 们 就 让 Dj[1][2]=D.[1][0]+D.1[0][2]=3， 同 样 的 Dj[2][1]=3， 
于 是 束 有 了 Do 的 矩阵 。 因 为 有 变化 ， 所 以 P 窍 阵 对 应 的 Pj1[1][2] 和 PL1[2] 
[1] 也 修改 为 当前 中 转 的 顶点 vo 的 下 标 09， 于 是 束 有 了 Po。 也 就 是 说 Do[v] 
[w]=min{D_,[v][w],D_,[v][0]+D_,[0][w]} 





接 下 来 ， 其 实 也 就 是 在 Do 和 Po 的 基础 上 继续 处 理 所 有 顶点 经 过 vj 和 Vv, 后 
到 达 男 一 顶点 的 最 短路 径 ， 得 到 D1 和 Pl1、D5 和 P, 完 成 所 有 顶点 到 所 有 顶 
点 的 最 短路 径 计算 工作 。 








如 果 我 就 用 这 么 简单 的 图 形 来 讲解 代码 ， 大 家 一 定 会 觉得 不 能 说 明 什 么 
问题 。 所 以 我 们 还 是 以 前 面 的 复杂 网 图 为 例 ， 来 讲解 弗 洛 伊 德 
(Floyd) 算法 。 








首先 我 们 针对 图 7-7-13 的 左 网 图 准备 两 个 窍 阵 D.1 和 P.1，D-. 就 是 网 图 的 
邻接 矩阵 ，P.1 初 设 为 PD 上 j]=j 这 样 的 矩阵 ， 它 主要 用 来 存储 路 径 。 
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图 7-7-13 





代码 如 下 ， 注 意 因为 是 求 所 有 顶点 到 所 有 顶点 的 最 短路 径 ， 因 此 
Pathmatirxz 和 ShortPathTable 都 是 二 维 数 组 。 


typedef int Pathmatirx[MAXVEX] [MAXVEX]; 

typedef int ShortPathTable[MAXVEX] [MAXVEX] / 

/* Floyd 算 法 ， 求 网 图 6 中 各 顶点 v 到 其 余 顶 点 w 最 短 
路 径 P[v] [w] 及 带 权 长 度 D[v] [w] */ 

void ShortestPath_Floyd(MGraph G, Pathmatirx *P, 

ShortPathTable *D) 

€ 

aE Wi. Whe. Lee 


/* 初始 化 D 与 P */ 
for (v = 0; v < G.numVertexes; ++v) 
for (w = 0; w < G.numVertexes; ++w) 





























/* D[v][w] 值 即 为 对 应 点 间 的 权 值 */ 
(*D)[v][w] = G.matirx[v][w]; 
/* 初 始 化 P */ 

(*P)[v][w] = wi 











+ 
for (k = 0; k < G.numVertexes; ++k) 
for (v = 0; v < G.numVertexes; ++v) 
for (w = 0; w < G.numVertexes; ++w) 


ia CO DNA > GD VA GD TR iw) 





/* 如 果 经 过 下 标 为 K 顶 点 路 径 比 原 两 点 间 路 径 更 短 */ 
/* 将 当前 两 点 间 权 值 设 为 更 小 的 一 个 */ 

(*D) [vV][w] = (*D)[v][k] + (*D)[k][w]; 

/* 路 径 设 置 经 过 下 标 为 k 的 顶点 */ 

(*P)[v][w] = (*P)[v][k]; 


























1. 程序 开始 运行 ， 第 4 一 11 行 就 是 初始 化 了 D 和 PP， 使 得 它们 成 为 图 7-7- 
13 的 两 个 矩阵 。 从 和 矩阵 也 得 到 ，vo 一 Vi 路径 权 值 是 1，vo 一 V5 路 径 权 值 是 
5，Vo 一 V3 无 边 连 线 ， 所 以 路 径 权 值 为 极 大 值 65535。 


2. 第 12~~25 行 ， 是 算法 的 主 循环 ， 一 共 三 层 艇 套 ，k 代 表 的 就 是 中 转 顶 


点 的 下 柄 。yv 代 表 起 始 項 点 , w 代 表 策 束 項 点 。 





3， 当 K=0 时 ， 也 就 是 所 有 的 顶点 都 经 过 vo 中 转 ， 计 算是 否 有 最 短路 径 的 
变化 。 可 惜 结果 是 ， 没 有 任何 变化 ， 如 图 7-7-14 所 示 。 
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图 7-7-14 


4. 当 K=1 时 ， 也 就 是 所 有 的 顶点 都 经 过 vi 中 转 。 此 时 ， 当 v=0 时 ， 原 本 
D[O][2 モ 5, 現在 由 干 D[O][1+D[11[2]4。 因 此 由 代 但 的 第 20 行 , 二 者 取 
其 最 小 值 ， 得 到 D[0][2]=4， 同 理 可 得 D[0][3]=8、D[0][4]=6， 当 v=2、 
3、4 时 ， 也 修改 了 一 些 数据 ， 请 参考 如 图 7-7-15 左 图 中 虚线 框 数 据 。 由 
于 这 些 最 小 权 值 的 修正 ， 所 以 在 路 径 窍 阵 P 上 ， 也 要 作 处 理 ， 将 它们 都 
改 为 当前 的 P[V][k] 值 ， 见 代码 第 21 行 。 
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图 7-7-15 





5. 接 下 来 束 是 k=2 一 直到 8 结束 ， 表 示 针 对 每 个 顶 反 做 中 转 得 到 的 计算 

结果 ， 当 然 ， 我 们 也 要 清楚 ，Do 是 以 Dj 为 基础 ， D1 是 以 D0 为 基础 ， 

O Da 是 以 D; 为 基础 ， 就 像 我 们 曾经 说 过 的 七 个 包子 的 故事 ， 它 们 是 

ae BEE MEP WEWE. w 4 k=8IN, PARE ACHE AN 7-7-16 
示 。 
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图 7-7-16 


至 此 ， 我 们 的 最 短路 径 就 算是 完成 了 ， 你 可 以 看 到 矩阵 第 vo 行 的 数值 与 
迪 杰 斯 特 拉 〈Dijkstra) 算法 求 得 的 D 数 组 的 数值 是 完全 相同 ， 都 是 
{0,1,4,7,5,8,10,12,16}。 而 且 这 里 是 所 有 顶点 到 所 有 顶点 的 最 短路 径 权 值 
和 都 可 以 计算 出 。 


那么 如 何 由 P 这 个 路 径 数 组 得 出 具体 的 最 短路 径 呢 ?以 vo 到 ve 为 例 ， 从 
图 7-7-16 的 右 图 第 vg 列 ，P[0][8]=1， 得 到 要 经 过 顶点 v1， 然 后 将 1 取代 0 


得 到 P[1][8]=2， 说 明 要 经 过 v，,，， 然 后 将 2 取代 1 得 到 P[2][8]=4， 说 明 要 经 
过 v4， 然 后 将 4 取代 2 得 到 P[4][8]=3， 说 明 要 经 过 va，.…….， 这 样 很 容易 


就 推导 出 最 终 的 最 短路 径 值 为 v0 Vi V5 VA Va => Vg V7 Vas 





求 最 短路 径 的 显示 代码 可 以 这 样 写 。 


for (v = 0; v < G.numVertexes; ++v) 
for (w = v + 1; w < G.numVertexes; w++) 


printf("v%d-v%d weight: %d ", v, w, D[v][w]); 
/* 获得 第 一 个 路 径 顶 点 下 标 */ 

k = P[v][w]; 

/* FTE */ 

PEIntheE paths edi avi): 

if HORE HLA ER 2 

while (k != w) 





/* 打印 路 径 顶 点 */ 
printi CES da ki) 
/* 获得 下 一 个 路 径 顶 点 下 标 */ 
k = P[k][w]; 

/* 打印 终点 */ 

printf(" -> %d\n", w); 


} 
DEENEN GANE) 


再 次 回 过 头 来 看 看 弗 洛 伊 德 (Floyd) 算法 ， 它 的 代码 简洁 到 就 是 一 个 
二 重 循环 初始 化 加 一 个 三 重 循环 权 值 修正 ， 就 完成 了 所 有 顶点 到 所 有 顶 
点 的 最 短路 径 计算 。 儿 乎 就 如 同 是 我 们 在 学 习 C 语 言 循环 拒 套 的 样 例 代 
码 而 已 。 如 此 简单 的 实现 ， 真 是 巧妙 之 极 ， 在 我 看 来 ， 这 是 非常 漂亮 的 
算法 , RADE BEM? 很 可 惜 由 于 它 的 三 重 循环 ， 因 此 也 是 
Oo5) 时 间 复 杂 度 。 如 果 你 面临 需要 求 所 有 项 点 至 所 有 项 点 的 最 短路 径 
问题 时 ， 弗 洛 伊 德 〈Floyd) 算法 应 该 是 不 错 的 选择 。 

















另外 ， 我 们 虽然 对 求 最 短路 径 的 两 个 算法 举例 都 是 无 问 图 ， 但 它们 对 有 
回 图 依然 有 效 ， 因 为 二 者 的 差 录 仅仅 是 邻接 矩阵 是 售 对 称 而 已 。 





7.8 拓扑 排序 


说 了 两 个 有 坏 的 图 应 用 ， 现 在 我 们 来 谈 谈 无 环 的 图 应 用 。 无 环 ， 即 是 图 
中 没有 回路 的 意思 。 


7.8.1 拓扑 排序 介绍 


我 们 会 把 施工 过 程 、 生 产 流程 、 软 件 开 发 、 教 学 安排 等 都 当成 一 个 项 目 
工程 来 对 等， 所 有 的 工程 都 可 分 为 耕 干 个 “活动 * 的 子 工 程 。 例 如 图 7-8-1 
在 我 这 非 专 业 人 士 绘制 的 一 张 电影 制作 流程 图 ， 现 实 中 可 能 并 不 完全 相 
同 ， 但 基本 表达 了 一 个 工程 和 奎 干 个 活动 的 概念 。 在 这 些 活动 之 间 ， 通 
常会 受到 一 定 的 条 件 约束 ， 如 其 中 杀 些 活动 必须 在 为 一 些 活动 完成 之 后 
才能 开始 。 就 像 电 影 制 作 不 可 能 在 人 员 到 位 进驻 场地 时 ， 导 演 还 没有 找 
到 ， 也 不 可 能 在 担 摄 过 程 中 ， 场 地 都 没有 。 这 都 会 导致 死 请 的 结果 。 因 
此 这 样 的 工程 图 ， 一 定 是 无 环 的 有 回 图 。 











在 一 个 表示 工程 的 有 癌 图 中 ， 用 顶点 表示 活动 ， 用 弧 表 示 活 动 之 间 的 优 
先 关 系 ， 这 样 的 有 癌 图 为 项 点 表示 活动 的 网 ， 我 们 称 为 AOV 网 
(ActivityOn Vertex Network) 。AOV 网 中 的 弧 表 示 活 动 之 间 存 在 的 某 
种 制约 关系 。 比 如 演 职 人 员 确 定 了 ， 场 地 也 联系 好 了 ， 才 可 以 开始 进 场 
招 摄 。 男 外 就 是 AOV 网 中 不 能 存在 回路 。 刚 才 已 经 举 了 例子 ， 让 茶 个 活 
动 的 开始 要 以 自己 完成 作为 先决 条 件 ， 显 然 是 不 可 以 的 。 








场景 拍摄] | (HRR 





图 7-8-1 


设 G=(VE) 是 一 个 具有 n 个 顶点 的 有 回 图 ，V 中 的 顶点 序列 wi，vV2， 
ek Vn， 满足 硝 从 顶 反 Vi 到 vj 有 一 条 路 人 符 ， 则 在 项 点 序列 中 顶 扣 vi 必 在 
顶点 Vi 之 前 。 则 我 们 称 这 样 的 顶点 序列 为 一 个 拓扑 序列 。 


图 7-8-1 这 样 的 AOV 网 的 拓扑 序列 不 止 一 条 。 序 列 Vo vi V2 V3 V4 Vs Ve V7 
Va Vo V10 V11 V12 V13 V14 V15 V16 是 一 条 拓扑 序列 ’ 而 vo V1 V4 Va V2 V7 Ve Vs 
Vg V10 Vg V12 V11 V14 V13 V15 Vvie 也 是 一 条 拓扑 序列 o 


所 谓 拓 扑 排序 ， 其 实 就 是 对 一 个 有 辐 图 构造 拓扑 序列 的 过 程 。 构 造 时 会 
有 两 个 结果 ， 如 果 此 网 的 全 部 顶点 都 被 输出 ， 则 说 明 它 是 不 存在 环 〈 回 
K) 的 AOV 网 ， 如 果 输 出 顶点 数 少 了 ， 哪 怕 是 少 了 一 个 ， 也 说 明 这 个 网 
存在 环 〈 回 路 ) ， 不 是 AOV 网 。 


一 个 不 存在 回路 的 AOV 网 ， 我 们 可 以 将 它 应 用 在 各 种 各 样 的 工程 或 项 目 
U 满足 各 种 应 用 场景 的 需要 ， 所 以 实现 拓扑 排序 的 算法 就 很 
IME ST 


7.8.2 ”拓扑 排序 算法 


对 AOV 网 进行 拓扑 排序 的 基本 思路 是 : 从 AOV 网 中 选择 一 个 入 度 为 0 的 
顶点 输出 ， 然 后 删 去 此 顶点 ， 并 删除 以 此 顶点 为 尾 的 弧 ， 继 续 重 复 此 步 
又 ， 直 到 输出 全 部 顶点 或 者 AOV 网 中 不 存在 入 度 为 0 的 顶点 为 止 。 





首先 我 们 需要 确定 一 下 这 个 图 需要 使 用 的 数据 结构 。 前 面 求 最 小 生成 树 
和 最 短路 径 时 ， 我 们 用 的 都 是 邻接 窍 阵 ， 但 由 于 拓扑 排序 的 过 程 中 ， 需 
要 删除 顶点 ， 显 然 用 邻接 表 会 更 加 方便 。 因 此 我 们 需要 为 AOV 网 建立 一 
个 邻接 表 。 考 虑 到 算法 过 程 中 始终 要 奉 找 入 度 为 0 的 顶点 ， 我 们 在 原来 
顶点 表 结 点 结构 中 ， 增 加 一 个 入 度 域 让， 结构 如 表 7-8-1 所 示 ， 其 中 ipn 刺 
征 入 度 的 数字 。 











表 7-8-1 


indata first edge 


因此 对 于 图 7-8-2 的 第 一 幅 图 AOV 网 ， 我 们 可 以 得 到 如 第 二 幅 图 的 邻接 
表 数 据 结 构 。 
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图 7-8-2 


在 拓扑 排序 算法 中 ， 涉 及 


/* 边 表 结 点 */ 
typedef struct EdgeNode 
{ 


的 结构 代码 如 下 。 





/* 邻接 点 域 ， 存 储 该 顶点 对 应 的 下 标 */ 


int adjvex; 

















/* 用 于 存储 权 值 ， 对 于 非 网 图 可 以 不 需要 */ 























int weight; 








/* 链 域 ， 指 向 下 一 个 邻接 点 */ 
struct EdgeNode *next; 


} EdgeNode; 
/* TARAA */ 
typedef struct VertexNode 





/* 顶点 入 度 */ 

inte an, 

/* 顶点 域 ， 存 储 顶 点 信息 
int data; 

7 zea 7 
EdgeNode *firstedge; 














if 


} VertexNode, AdjList [MAXVEX] / 


typedef struct 


AdjList adjList; 
/* 图 中 当前 顶点 数 和 边 数 

















A 


int numVertexes, numEdges; 


} graphAdjList, *GraphAdj 


[eats 


在 算法 中 ， 我 还 再 要 辅助 的 数据 结构 一 栈 ， 用 来 存储 处 理 过 程 中 入 度 为 
0 的 顶点 ， 目 的 是 为 了 避免 每 个 查找 时 都 要 去 过 有 历 顶 点 表 找 有 没有 入 度 


为 0 的 顶点 。 





现在 我 们 来 看 代码 ， 并 且 模 拟 运 行 它 。 








/* 拓扑 排序 ， 知 GL 无 回路 ， 则 输出 拓扑 排序 序列 






































返回 OK， 若 有 回路 返回 ERROR */ 
Status TopologicalSort(GraphAdjList GL) 


























EdgeNode *e: 
int i, k, gettop; 








/* 用 于 栈 指针 下 标 */ 

int top = 0; 

/* 用 于 统计 输出 顶点 的 个 数 */ 

Ine count = Oe 

/* 建 栈 存 储 入 度 为 9 的 顶点 */ 

int *stack; 

stack = (int *)malloc(GL->numVertexes * sizeof(int)); 

for (i = 0; i < GL->numVertexes; i++) 

if (GL->adjList[i].in == 0) 

/* 将 入 度 为 9 的 顶点 入 栈 */ 
stack[++top] = i; 

while (top != 0) 


























Hie tanto 7h 

gettop = stack[top--]; 

/* 打印 此 顶点 */ 

printf("%d -> ", GL->adjList[gettop].data); 

/* 统计 输出 顶点 数 */ 

count++; 

/* SUC */ 

for (e = GL->adjList[gettop].firstedge; e; e = e->next) 








i 
k = e->adjvex; 
/* 将 k 号 顶点 邻接 点 的 入 度 减 1 */ 
if (!(--GL->adjList[k].in)) 
/* 若 为 6 则 入 栈 ， 以 便于 下 次 循环 输出 */ 
stack[++top] = k; 
} 





J 
/* 如 果 count 小 于 顶点 数 ， 说 明 存 在 环 */ 
if (count < GL->numVertexes) 
return ERROR: 
else 
return OK; 





1. 程序 开始 运行 ， 第 3 一 7 行 都 是 变量 的 定义 ， 其 中 stack 是 一 个 栈 ， 用 
来 存储 整 型 的 数字 。 


2. 第 8 一 10 行 ， 作 了 一 个 循环 判断 ， 把 入 度 为 0 的 顶点 下 标 都 入 栈 ， 从 
图 7-8-3 的 右 图 邻接 表 可 知 ， 此 时 stack 应 该 为 : {0,1,3}， 即 vo、vV1、V3 的 
顶点 入 度 为 0， 如 图 7-8-3 所 示 。 





7-8-3 


3. 第 12 一 23 行 , 


4. 第 14 一 16 行 ， 


5. 第 17 一 22 行 ， 
4 中 的 灰色 部 分 ， 


while 循 环 ， 当 栈 中 有 数据 元 素 时 ， 始 终 循 环 。 


V3 出 栈 得 到 gettop=3。 并 打印 此 顶点 ， 然 后 count 加 1。 


人 循环 其 实 是 对 v3 顶点 对 应 的 弧 链 表 进 行 遇 历 ， 即 图 7-8- 
找到 v3 连接 的 两 个 顶点 v, 和 v13， 并 将 它们 的 入 度 减少 


一 位 ， 此 时 Vv 和 v13 的 in 值 都 为 1。 它 的 目的 是 为 了 将 v3 顶点 上 的 弧 删 
除 。 


UMEDA 





图 7-8-4 


6. 再 次 循环 ， 第 12 一 23 行 。 此 时 处 理 的 是 项 点 Yi。 经 过 出 栈 、 打 印 、 

count=2 后 ， 我 们 对 Vi 到 v、v、vs 的 跑 进 行 了 明 历 。 并 同样 减少 了 它们 
的 入 度数 ， 此 时 vw 入 度 为 0， 于 是 由 第 20 一 21 行 知 ，V 入 栈 ， 如 网 7-8-5 
所 示 。 试 想 ， 如 果 没 有 在 顶点 表 中 加 入 in 这 个 入 度数 据 域 ，20 行 的 判断 
就 必须 要 是 循环 ， 这 显然 是 要 消耗 时 间 的 ， 我 们 利用 空间 换取 了 时 间 。 











ーーー 
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图 7-8-5 





7. 接 下 来 ， 就 是 同样 的 处 理 方式 了 。 图 7-8-6 展 示 了 w ve Vo Va Vs wa 的 打 
印 删 除 过 程 ， 后 面 还 剩 几 个 顶点 都 类 似 ， 就 不 图 示 了 。 








图 7-8-6 


8. 最 终 拓扑 排序 打印 结果 为 3->1->2->6->0->4->5->8->7->12->9->10- 
>13->11。 当 然 这 结果 并 不 是 唯一 的 一 种 拓扑 排序 方案 。 





分 析 整个 算法 ， 对 一 个 具有 n 个 顶点 e 条 弧 的 AOV 网 来 说 ， 第 8 一 10 行 扫 
描 顶 点 表 ， 将 入 度 为 0 的 顶点 入 栈 的 时 间 复杂 为 O(n)， 而 之 后 的 while 往 
环 中 ， 每 个 顶点 进 一 次 栈 ， 出 一 次 栈 ， 入 度 减 1 的 操作 共 执 行 了 e 次 ， 所 
以 整个 算法 的 时 间 复 杂 度 为 On+e]。 


7.9 KIRKE 


拓扑 排序 主要 是 为 解决 一 个 工程 能 否 顺序 进行 的 问题 ， 但 有 时 我 们 还 需 
要 解决 工程 完成 需要 的 最 短 时 间 问 题 。 比 如 说 ， 造 一 辆 汽车 ， 我 们 需要 
先 造 各 种 各 样 的 零件 、 部 件 ， 最 终 再 组 装 成 车 ， 如 图 7-9-1 所 示 。 这 些 零 
部 件 基本 都 是 在 流水 线 上 同时 生产 的 ， 假 如 造 一 个 轮子 需要 0.5 天 时 
问 ， 造 一 个 发 动机 需要 3 天 时 间 ， 造 一 个 车 底盘 需要 2 天 时 间 ， 造 一 个 外 
需要 2 天 时 间 ， 其 他 零 部 件 时 间 需 要 2 天 ， 全 部 零 部 件 集中 到 一 处 需要 
05k, 组 装 成 车 需要 2 天 时 间 ， 请 问 ， 在 汽车 广 造 一 辆 车 ， 最 短 需要 多 
少时 间 呢 ? 























图 7-9-1 


有 人 说 时 间 就 是 全 部 加 起 来 ， 这 当然 是 不 对 的 。 我 已 经 说 了 前 提 ， 这 些 
零 部 件 都 是 分 别 在 流水 线 上 同时 生产 的 ， 也 就 是 说 ， 在 生产 发 动机 的 3 
天 里 ， 可 能 已 经 生产 了 6 个 轮 予 ，1.5 个 外 壳 和 1.5 个 底盘 ， 而 组 装 车 是 在 
这 些 零 部 件 都 生产 好 后 才 可 以 进行 。 因 此 最 短 的 时 间 其 实 是 零 部 件 中 生 
产 时 间 最 长 的 发 动机 3 天 + 集中 零 部 件 0.5 天 + 组 装 车 的 2 天 ， 一 共 5.5 天 完 
成 一 辆 汽车 的 生产 。 








因此 ， 我 们 如 林 要 对 一 个 流程 图 获得 最 短 时 间 ， 就 必须 要 分 析 它 们 的 拓 
扑 关 系 ， 并 且 找 到 当中 最 关键 的 流程 ， 这 个 流程 的 时 间 就 是 最 短 时 间 。 





因此 在 前 面 讲 了 AOV 网 的 基础 上 ， 我 们 来 介绍 一 个 新 的 概念 。 在 一 个 表 
示 工 程 的 带 权 有 问 图 中 ， 用 顶点 表示 事件 ， 用 有 辣 边 表示 活动 ， 用 边 上 
的 权 值 表示 活动 的 持续 时 间 ， 这 种 有 回 图 的 边 表示 活动 的 网 ， 我 们 称 之 
为 AOE 网 (Activity On Edge Net-work) 。 我 们 把 AOE 网 中 没有 入 边 的 
顶点 称 为 始点 或 源 点 ， 没 有 出 边 的 顶点 称 为 终点 或 汇 点 。 由 于 一 个 工 
程 ， 总 有 一 个 开始 ， 一 个 结束 ， 所 以 正常 情况 下 ，AOE 网 只 有 一 个 源 点 
一 个 汇 点 。 例 如 图 7-9-2 就 是 一 个 AOE 网 。 其 中 vo 即 是 源 点 ， 表 示 一 个 工 
程 的 开始 ， Ve A, 表示 整个 工程 的 结束 ， 顶点 vo， V1? ーー… ’ va 分 
列表 示 事 件 , 弧 <vo,vI>， く Vo,V っ クッ SAS ’ <ve,Vo> 都 表示 一 个 活动 ， 用 
Sd Si ，a12 表 示 ， 它 们 的 值 代表 着 活动 持续 的 时 间 ， 比 如 弧 
<VoVv1> 就 是 从 源 点 开始 的 第 一 个 活动 aao， 它 的 时 间 是 3 个 单位 。 




















an 





图 7-9-2 





既然 AOE 网 是 表示 工程 流程 的 ， 所 以 它 就 具有 明显 的 工程 的 特性 。 如 有 
在 菏 顶 点 所 代表 的 事件 发 生 后 ， 从 该 顶点 出 发 的 各 活动 才能 开始 。 只 有 
在 进入 茶 顶 点 的 各 活动 都 已 经 结束 ， 该 顶点 所 代表 的 事件 才能 发 生 。 


尽管 AOE 网 与 AOV 网 都 是 用 来 对 工程 建 模 的 ， 但 它们 还 是 有 很 大 的 不 

同 ， 主 要 体现 在 AOV 网 是 顶点 表示 活动 的 网 ， 它 只 描述 活动 之 间 的 制约 
关系 ， 而 AOE 网 是 用 边 表 示 活 动 的 网 ， 边 上 的 权 值 表示 活动 持续 的 时 

间 ， 如 图 7-9-3 所 示 两 图 的 对 比 。 因 此 ，AOE 网 是 要 建立 在 活动 之 间 制 

约 关系 没有 矛盾 的 基础 之 上 ， 再 来 分 析 完 成 整个 工程 至 少 需 要 多 少时 

间 ， 或 者 为 缩短 完成 工程 所 需 时 间 ， 应 当 加 快 哪些 活动 等 问题 。 
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图 7-9-3 


我 们 把 路 径 上 各 个 活动 所 持续 的 时 间 之 和 称 为 路 径 长 度 ， 从 源 点 到 汇 点 
具有 最 大 长 度 的 路 径 叫 关键 路 符 ， 在 关键 路 符 上 的 活动 叫 天 键 活动 。 显 
然 就 图 7-9-3 的 AOE 网 而 言 ， 开 始 » 发 动机 完成 -部 件 集 中 到 位 组 装 
完成 就 是 关键 路 径 ， 路 径 长 度 为 5.5。 





如 果 我 们 需要 缩短 整个 工期 ， 去 改进 轮子 的 生产 效率 ， 哪 介 改 动 成 0.1 
也 是 无 荔 于 整个 工期 的 变化 ， 只 有 缩短 关键 路 径 上 的 关键 活动 时 间 才 可 
以 减少 整个 工期 长 度 。 例 如 如 果 发 动机 制造 缩短 为 2.5， 整 车 组 闭 缩 短 
为 1.5， 那 么 关键 路 径 长 度 就 为 4.5， 整 整 缩短 了 一 天 的 时 间 。 


那么 现在 的 问题 束 是 如 何 找 出 关键 路 径 。 对 人 来 说 ， 图 7-9-3 第 二 幅 这 样 








的 AOE 网 ， 应 该 比较 容易 得 出 关键 路 径 的 ， 而 对 于 图 7-9-2 的 AOE 网 ， 
就 相对 麻烦 一 些 ， 如 果 继 续 复 杂 下 去 ， 可 能 就 非 人 脑 该 去 做 的 事 了 。 








7.9.1 关键 路 径 算 法 原理 


为 了 讲 清楚 求 关键 路 径 的 算法 ， 我 还 是 来 举 个 例子 。 假 设 一 个 学 生 放 学 
回 家 ， 除 挥 吃 饭 、 洗 濑 外 ， 到 睡觉 前 有 四 小 时 空间， 而 家 性 作业 需要 两 
小 时 完成 。 不 同 的 学 生 会 有 不 同 的 做 法 ， 抓 紧 的 学 生 ， 会 在 头 两 小 时 就 
完成 作业 ， 然 后 看 看 电视 、 访 读 课 外 书 什么 的 ; 但 也 有 超过 一 半 的 学 生 
会 在 最 后 两 小 时 才 去 做 作业 ， 要 不 是 因为 没 时 间 ， 可 能 还 要 再 拖延 下 
去 。 下 面 的 同学 不 要 笑 ， 像 是 在 说 你 的 是 吧 ， 你 们 是 不 是 有 过 里 假 两 个 
月 ， 要 到 最 后 几 天 才 去 赶 作业 的 坏 毛 病 呀 ? 这 也 没什么 好 奇怪 的 ， 拖 延 
就 是 人 性 几 大 弱 氮 之 一 。 























这 里 做 家 庭 作业 这 一 活动 的 最 早 开始 时 间 是 四 小 时 的 开始 ， 可 以 理解 为 
0， 而 最 晚 开 始 时 间 是 两 小 时 之 后 马上 开始 ， 不 可 以 再 晚 ， 否 则 就 是 延 
迟 了 ， 此 时 可 以 理解 为 >。 显然， 当 最 早 和 最 晚 开 始 时 间 不 相等 时 就 意 
味 着 有 空闲 。 





接着 ， 你 老 妈 发 现 了 你 拖延 的 小 秘密 ， 于 是 买 了 很 多 的 读 外 习题 ， 要 求 
你 四 个 小 时 ， 不 许 有 一 丝 空 用 ， 省 得 你 拖延 或 偷懒 。 此 时 整个 四 小 时 全 
部 被 占 满 ， 最 早 开 始 时 间 和 最 晚 开 始 时 间 都 是 0， 因 此 它 就 是 关键 活动 
了 。 





也 惑 是 说 ， 我 们 只 需要 找到 所 有 活动 的 最 时 开始 时 间 和 最 晚 开始 时 间 ， 
并 且 比 较 它 们 ， 如 果 相 等 就 意味 着 此 活动 是 关键 活动 ， 活 动 间 的 路 径 为 
KER. WRD, MDE 





为 此 ， 我 们 需要 定义 如 下 几 个 参数 。 

1. 事 件 的 最 早 发 生 时 间 etv Cearliest time ofvertex) : 即 頂 点 v, 的 最早 友 
生 时 间 。 

2. 事 件 的 最 晚 发 生 时 间 1ltv (latest time ofvertex) : 即 頂 点 v 的 最 晩 友 生 
时 间 ， 也 就 是 每 个 顶点 对 应 的 事件 最 晚 需 要 开始 的 时 间 ， 超 出 此 时 间 将 
会 延误 整个 工期 。 

3. 活 动 的 最 早 开 工时 间 ete Cearliest time ofedge) : 即 弧 a 的 最 早 发 生 时 
间 。 











4. 活 动 的 最 晚 开 工时 间 lte Clatest time ofedge) : 即 弧 a 的 最 晚 发 生 时 
间 ， 也 就 是 不 推迟 工期 的 最 晚 开 工时 间 。 


我 们 是 由 1 和 2 可 以 求 得 3 和 4， 然 后 再 根据 ete[k] 古 合 与 lte[k] 相 等 来 判断 
ak 是 售 是 关键 活动 。 


7.9.2 ”关键 路 径 算法 


我 们 将 图 7-9-2 的 AOE 网 转化 为 邻接 表 结 构 如 图 7-9-4 所 示 ， 注 意 与 拓扑 
排序 时 邻接 表 结 构 不 同 的 地 方 在 于 ， 这 里 弧 链 表 增 加 了 weight 域 ， 用 来 
存储 弧 的 权 值 。 
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图 7-9-4 





求 事件 的 最 早 发 生 时 间 etv 的 过 程 ， 束 是 我 们 从 头 全 尾 找 拓 扑 序列 的 过 
程 ， 因 此 ， 在 求 关键 路 径 之 前 ， 需 要 先 调 用 一 次 拓扑 序列 算法 的 代码 来 
计算 etv 和 拓扑 序列 列表 。 为 此 ， 我 们 首先 在 程序 开始 处 声明 几 个 全 局 


变量 。 





























SE SEN IVA /* 事件 最 早 发 生 时 间 和 最 述 发 生 时 间 数 组 */ 
int *stack2; /* 用 于 存储 拓扑 序列 的 栈 */ 
int top2; /* 用 干 stack2 的 指針 */ 











其 中 stack2 用 来 存储 拓扑 序列 ， 以 便 后 面 求 关 键 路 径 时 使 用 。 


下 面 是 改进 过 的 求 拓扑 序列 算法 。 











/* 拓扑 排序 ， 用 于 关键 路 径 计 算 “/ 
Status TopologicalSort(GraphAdjList GL) 











EdgeNode *e: 
int i, k, gettop; 
/* 用 于 栈 指针 下 标 */ 
int top = 0; 
/* 用 于 统计 输出 顶点 的 个 数 */ 
mteacounte = OF 
/* 建 栈 将 入 度 为 6 的 顶点 入 栈 */ 
int *stack; 
stack = (int *)malloc(GL->numVertexes * sizeof(int)); 
for (i = 0; i < GL->numVertexes; i++) 
if (0 == GL->adjList[i].in) 
stack[++top] = i; 
/* 初始 化 为 9 */ 
top2 = 0; 
/* 事件 最 早 发 生 时 间 */ 
etv = (int *)malloc(GL->numVertexes * szeof( 1nt ) ) 
for (i = 0; i < GL->numVertexes; ユ ++ ) 
/* 初始 化 为 9 */ 
etv[1] = 0; \ 
/* 初始 化 */ 
stack2 = (int *)malloc(GL->numVertexes * sizeof(int)); 
while (top != 0) 
{ 






































gettop = stack[top--]; 
count++; 





/* 将 弹出 的 顶点 序号 压 入 拓扑 序列 的 栈 */ 

Stack2[++top2] = gettoD: 

for (e = GL->adjList[gettop].firstedge; e; e = e->next) 
ab 








k = e->adjvex; 

if (!(--GL->adjList[k].in)) 
stack[++top] = k; 

/* 求 各 顶点 事件 最 早 发 生 时 间 值 */ 

if ((etv[gettop] + e->weight) > etv[k]) 
etv[k] = etv[gettop] + e->weight; 





























} 
if (count < GL->numVertexes) 
return ERROR: 


else 
return OK; 


代码 中 ， 除 加 粗 部 分 外 ， 与 前 面 讲 的 拓扑 排序 算法 没有 什么 不 同 。 


第 11 一 15 行 为 初始 化 全 局 变量 etv 数 组 、top2 和 stack2 的 过 程 。 第 21 行 就 
是 将 本 是 要 输出 的 拓扑 序列 压 入 全 局 栈 stack2 中 。 第 27 一 28 行 很 关键 ， 

它 是 求 etv 数 组 的 每 一 个 元 素 的 值 。 比 如 说 ， 假 如 我 们 已 经 求 得 顶点 vo 对 
应 的 etv[0]=0， 顶 点 Vj 对 应 的 etv[1]=3， 顶 点 v2 对 应 的 etv[2]=4， 现 在 我 们 
需要 求 顶点 va 对 应 的 etv[3]， 其 实 就 是 求 etv[1]+len<vl,v3a> 与 
etv[2]+len<vva> 的 较 大 值 。 显 然 3+5<4+8， 得 到 etv[3]=12， 如 图 7-9-5 所 
示 。 在 代码 中 e->weight 就 是 当前 弧 的 长 度 。 
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图 7-9-5 


由 此 我 们 也 可 以 得 出 计算 项 点 wk 即 求 etv[ 的 最 早 发 生 时 间 的 公式 是 : 


其 中 P[K] 表 示 所 有 到 达 顶 点 Vv 的 弧 的 集合 。 比 如 图 7-9-5 的 P[3] 束 是 


<Vv1,V3> 和 <V,V3> 两 条 弧 。len<vi,vI> 是 弧 <vi,vw> 上 的 权 值 。 


下 面 我 们 来 看 求 关键 路 径 的 算法 代码 。 


/* 求 关键 路 径 ，GL 为 有 向 网 ， 输 出 6GL 的 各 项 关键 活动 */ 
void CriticalPath(GraphAdjList GL) 

















































































































{ 
EdgeNode *e; 
nt gettop, Ke 
/* 声明 活动 最 早 发 生 时 间 和 最 迟 发 生 时 间 变 量 */ 
int ete, lte; 
/* 求 拓扑 序列 ， 计 算数 组 etv 和 stack2 的 值 */ 
TopologicalSort(GL); 
/* 事件 最 晚 发 生 时 间 */ 
ltv = (int *)malloc(GL->numVertexes * szeof( 1nt ) ) 
for (i = 0; i < GL->numVertexes; i++) 
/* 初始 化 ltv */ 
ltv[i] = etv[GL->numVertexes - 1]; 
TEC 
while (top2 != 0) 
{ 
/* 将 拓扑 序列 出 栈 ， 后 进 先 出 */ 
gettop = stack2[top2--]; 
for (e = GL->adjList[gettop].firstedge; e; e = e->next) 
/* 求 各 顶点 事件 的 最 述 发 生 时 间 1tv 值 */ 
k = e->adjvex; 
/* 求 各 顶点 事件 最 晚 发 生 时 间 ]ltv */ 
if (ltv[k] - e->weight < ltv[gettop]) 
ltv[gettop] = ltv[k] - e->weight; 
} 
y 
/* 求 ete，1Lte 和 关键 活动 */ 
for (j = 0; j < GL->numVertexes; j++) 
{ 
for (e = GL->adjList[j].firstedge; e; e = e->next) 
{ 
k = e- >adjvex; 
大 酒 ; 动 最 早 发 生 时 间 */ 
ete = etV[]] 
/* 活动 最 迟 发 生 时 间 */ 
NE S = ltv[k] - e->weight; 
* 两 者 相等 即 在 关键 路 径 上 */ 
if (ete == lte) / 
printf("<v%d, v%d> length: %d , ", 
GL->adjList[j].data, GL- >adjList[k] . data, e->weight); 
+ 
} 
J 





程序 开始 执行 。 第 5 行 ， 声 明了 ete 和 lte 两 个 活动 最 早 最 晚 发 生 时 间 变 


O 


1 
量 


2. 第 6 行 ， 调 用 求 拓 扑 序列 的 函数 。 执 行 完 毕 后 ， 全 局 变量 数组 etv 和 
栈 stack 的 值 如 图 7-9-6 所 示 ，top2=10。 也 就 是 说 ， 对 于 每 个 事件 的 最 早 
发 生 时 间 ， 我 们 已 经 计算 出 来 了 。 
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图 7-9-6 


3. 第 7 一 9 行为 初始 化 全 局 变量 ltv 数 组 ， 因 为 etv[9]=27， 所 以 数组 ltv 当 
前 的 值 为 ，{27,27,27,27,27,27,27,27,27,27} 


4. 第 10 一 19 行 为 计算 ltv 的 循环 。 第 12 行 ， 先 将 stack2 的 栈 头 出 栈 ， 由 后 
进 先 出 得 到 gettop=9。 根 据 邻 接 表 中 ，ve 没 有 弧 表 ， 所 以 第 13 一 18 行 循 
环 体 未 执行 


5. 再 次 来 到 第 12 行 ，gettop=8， 在 第 13 一 18 行 的 循环 中 ，vs 的 弧 表 只 有 
VV 第 15 行 得 到 k=9， 因为 ltv[9]-3<ltv[8]， 所 以 
ltv[8]=ltv[9]-3=24， 如 图 7-9-7 所 示 。 
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图 7-9-7 


6. 再 次 循环 ， 当 gettop=7、5、6 时 ， 同 理 可 算出 ltv 相 对 应 的 值 为 19、 





13、25， 此 时 ]tv 值 为 : {27, 27, 27, 27, 27, 13, 25, 19, 24, 27} 


7. 当 gettop=4 时 ， 由 邻接 表 可 得 到 v4 有 两 条 弧 <v4v6e>、<v4vz>， 通 过 第 
13 一 18 行 的 循环 ， 可 以 得 到 ltv[4]=min(ltv[7]-4,ltv[6]-9)=min(19-4,25- 
9)=15， 如 图 7-9-8 所 示 。 
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图 7-9-8 


此 时 你 应 该 发 现 ， 我 们 在 计算 ltv 时 ， 其 实 是 把 拓扑 序列 倒 过 来 进行 的 。 
因此 我 们 可 以 得 出 计算 顶点 vk 即 求 ltv[k] 的 最 晚 发 生 时 间 的 公式 是 : 


et kh = 用 


Mk に 
mt min lt] -len< VV, >} Akemi < yy >E si 


其 中 S[K] 表 示 所 有 从 顶点 Vv 出 发 的 弧 的 集合 。 比 如 图 7-9-8 的 S[4] 束 是 


<V4,Ve> Fl <v4,V7> IM ’ en<Vovj> 是 弧 <vievi> 上 的 权 值 o 


就 这 样 ， 当 程序 执行 到 第 20 行 时 ， 相 关 变 量 的 值 如 图 7-9-9 所 示 ， 比 如 
etv[1]=3 而 ltv[1]=7， 表 示 的 意思 就 是 如 果 时 间 单 位 是 天 的 话 ， 哪 怕 vj 这 
个 事件 在 第 7 天 才 开 始 ， 也 可 以 保证 整个 工程 的 按期 完成 ， 你 可 以 提前 
Vv 事件 开 始 时 间 ， 但 你 最 早 也 只 能 在 第 3 天 开始 。 跟 我 们 前 面 举 的 例 
子 ， 是 先 完 成 作业 再 玩 还 是 先 玩 最 后 完成 作业 一 个 道理 。 
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图 7-9-9 





8. 第 20 一 31 行 是 来 求 另 两 个 变量 活动 最 早 开 始 时 间 ete 和 活动 最 晚 开 始 
时 间 lte， 并 对 相同 下 标的 它们 做 比较 。 两 重 循环 钥 套 是 对 邻接 表 的 项 抬 
和 每 个 项 点 的 弧 表 裔 历 。 





9. 当 j=0 时 ， 从 vo 点 开始 ， 有 <vo,v2> 和 <vo,v1> 两 条 弧 。 当 k=2 时 ， 
ete=etv[j]=etv[0]=0。 lte=]tv[k]-e->weight=]tv[2]-len<vo,v2>=4-4=0， 此 时 
ete=lte， 表 示 弧 <vo,v> 是 关键 活动 ， 因 此 打印 。 当 k=1 时 ， 
ete=etv[j]=etv[0]=0。lte=ltv[k]-e->weight=ltv[1]-len<vovi>=7-3=4， 此 时 
etez#lte， 因 此 <vov1> 并 不 是 关键 活动 ， 如 图 7-9-10 所 示 。 
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图 7-9-10 








这 里 需要 解释 一 下 ，ete 本 来 是 表示 活动 <vevj> 的 最 早 开工 时 间 ， 是 针对 
弧 来 说 的 。 但 只 有 此 弧 的 弧 尾 顶 点 vi 的 事件 发 生 了 ， 它 才 可 以 开始 ， 
此 ete=etv[k]。 





而 lte 表 示 的 是 活动 <vevi> 的 最 晚 开 工时 间 ， 但 此 活动 再 晚 也 不 能 等 Vj 事 
件 有 发 生 才 开始 ， 而 必须 要 在 wj 事件 之 前 发 生 ， 所 以 lte=ltv[j]-len<viovj>。 
就 像 你 晚上 23 点 睡觉 ， 你 不 能 说 到 23 点 才 开 始 做 作业 ， 而 必须 要 提前 2 
小 时 ， 在 21 点 开始 ， 才 有 可 能 按时 完成 作业 。 





所 以 最 终 ， 其 实 就 是 判断 ete 与 te 是否 相等 ， 相 等 意味 着 活动 没有 任何 至 
闲 ， 是 关键 活动 ， 否 则 就 不 是 。10. j=1 一 直到 j=9 为 止 ， 做 法 是 完全 相 
同 的 , SO BERR ETT E25 RAI “<vo,V2>4,<V5,V3>8,<V3,V4>3,<V4,V7>4, 
<V7,Vg>5,<Vg,Vo>3,"> 最 终 关 键 路 径 如 图 7-9-11 所 示 。 





图 7-9-11 


分 析 整 个 求 关键 路 径 的 算法 ， 第 6 行 是 拓扑 排序 ， 时 间 复 杂 上 度 为 
OO+e)， 第 8 一 9 行 时 间 复 杂 度 为 OOm， 第 10 一 19 行 时 间 复 休 度 为 
Or+e)， 第 20 一 31 行 时 间 复 杂 也 为 OOn+e)， 根 据 我 们 对 时 间 复 杂 度 的 定 
义 ， 所 有 的 常数 系数 可 以 忽略 ， 所 以 最 终 求 关键 路 径 算法 的 时 间 复 杂 度 











依然 是 O(n+e)。 


实践 证 明 ， 通 过 这 样 的 算法 对 于 工程 的 前 期 工期 估算 和 中 期 的 计划 调整 
都 有 很 大 的 帮助 。 不 过 注意 ， 本 例 是 唯一 一 条 关键 路 径 ， 这 并 不 等 于 不 
存在 多 条 关键 路 径 的 有 癌 无 环 岁 。 如 果 是 多 条 关键 路 径 ， 则 单 是 提高 一 
条 天 键 路 径 上 的 关键 活动 的 速度 并 不 能 导致 整个 工程 缩短 工期 ， 而 必须 
提高 同时 在 几 条 关键 路 径 上 的 活动 的 速度 。 这 就 像 仅 仅 是 有 事业 的 成 

ST 

P = 一 不可 。 











7.10 ”总 结 回顾 


图 十 计算 机 科学 中 非 第 第 用 的 一 类 数据 结构 ， 有 许 许 多 多 的 计算 问题 都 
是 用 图 来 定义 的 。 由 于 图 也 是 最 复杂 的 数据 结构 ， 对 它 讲解 时 ， 涉 及 到 
数组 、 链 表 、 栈 、 队 列 、 树 等 之 前 学 的 几乎 所 有 数据 结构 。 因 此 从 菏 种 
角度 来 说 ， 学 好 了 图 ， 基 本 就 等 于 理解 了 数据 结构 这 门 课 的 精神 。 


我 们 在 图 的 定义 这 一 他， 介绍 了 一 大 扒 定 义 和 术 语 ， 一 开始 可 能 会 有 些 
迷 洗 , AE IBA, Se) Li, ZEA RR) VA BERRI EE ATE 
征 , FER SUX "INA, RIN CAAA ZH, LEMAR 
To 





图 的 存储 结构 我 们 一 共 讲 了 五 种 ， 如 图 7-10-1 所 示 ， 其 中 比较 重要 的 是 
邻接 矩阵 和 邻接 表 ， 它 们 分 别 代表 着 边 集 是 用 数组 还 是 链表 的 方式 存 
储 。 十 字 链 表 是 针对 有 向 图 邻接 表 结 构 的 优化 ， 邻 接 多 重 表 是 针对 无 向 

邻接 表 结 构 的 优化 。 边 集 数 组 更 多 考虑 的 是 对 边 的 关注 。 用 什么 存储 
结构 需要 具体 问题 具体 分 机 ， 通 利 笛 密 图 ， 或 读 存 数据 较 多 ， 结 构 修改 
较 少 的 图 ， 用 邻接 矩阵 要 更 合适 ， 反 之 则 应 该 考虑 邻接 表 。 




















图 的 人 存储 结构 
近作 ee URIA 


链表 TOE 


图 7-10-1 


图 的 损 历 分 为 深度 和 广度 两 种 ， 各 有 优 缺 点 ， 就 像 人 在 奶 求 辕 越 时 ， 是 
着 重 深度 还 是 看 重 广度 ， 总 是 很 难说 得 清楚 。 








图 的 应 用 是 我 们 这 一 章 浓 墨 重 彩 的 一 部 分 ， 一 共 谈 了 三 种 应 用 : 最小 生 
成 树 、 最 短路 径 和 有 向 无 环 图 的 应 用 。 


最 小 生成 树 ， 我 们 讲 了 两 种 算法 : 普 里 姆 (Prim) 算法 和 元 鲁 斯 卡尔 
(Kruskal) 算法 。 普 里 姆 算法 像 是 走 一 步 看 一 步 的 思维 方式 ， 逐 步 生 成 

















最 小 生成 树 。 而 殉 鲁 斯 卡尔 算法 则 更 有 全 局 意识 ， 直 接 从 图 中 最 短 权 值 
的 边 入 手 ， 找 寻 最 后 的 答案 。 








最 短路 径 的 现实 应 用 非常 多 ， 我 们 也 介绍 了 两 种 算法 。 迪 杰 斯 特 拉 
(Dijkstra) 算法 更 强调 单 源 顶点 查找 路 径 的 方式 ， 比 较 符 合 我 们 正 锦 
的 思路 ， 容 易 理 解 原 理 ， 但 算法 代码 相对 复杂 。 而 弗 洛 伊 德 〈Floyd ) 
算法 则 完全 抛 开 了 单 点 的 局 限 思 维 方式 ， 巧 妙 地 应 用 和 矩阵 的 变换 ， 用 最 
清 丈 的 代码 实现 了 多 顶点 间 最 短路 径 求 解 的 方案 ， 原 理 理解 有 难度 ， 但 
算法 编写 很 简洁 。 








有 辣 无 环 图 时 和 常 应 用 于 工程 规划 中 ， 对 于 整个 工程 或 系统 来 说 ， 我 们 一 
方面 关心 的 是 工程 能 否 顺 利 进行 的 问题 ， 通 过 拓扑 排序 的 方式 ， 我 们 可 
以 有 效 地 分 析出 一 个 有 向 图 是 否 存 在 环 ， 如 果 不 存在 ， 那 它 的 拓扑 序列 
是 什么 ? 另 一 方面 关心 的 是 整个 工程 完成 所 必须 的 最 短 时 间 问 题 ， 利 用 
ROPER EH FHS 可 以 得 到 最 短 完成 工程 的 工期 以 及 关键 的 活动 有 哪 

















事实 上 ， 图 的 应 用 算法 还 有 不 少 ， 本 章节 只 是 抛砖引玉 ， 有 兴趣 的 同学 
可 以 去 查阅 相关 的 书籍 获得 更 多 的 知识 。 


7.11 4B 





IB FS EC ANT TP SATAN De eS 2 如 果 现 在 对 应 该 如 何 去 做 还 答 不 上 

来 ， 那 束 非 常 不 应 该 了 。 全 国 所 有 省 市 的 最 佳 旅游 路 线 ， 只 要 你 可 以 得 
到 每 个 相 邻 城市 间 的 交通 距离 ， 其 实 就 是 最 小 生成 树 算法 要 解决 的 问 

题 。 当 然 现 实 中 ， 可 能 会 比较 复杂 ， 考 碟 的 因素 较 多 ， 但 再 复杂 的 问题 
也 是 从 基本 的 算法 开始 入 手 的 ， 你 部 已 经 拥有 了 人 金 手 指 ， 还 担心 不 能 扣 
AREH? 

















最 后 , RHA EIEE AA EA Ee PBS... E, EA 
大 家 ， 来 结束 我 们 这 一 章 的 课程 。 








世界 上 最 遥远 的 距离 ， 


不 是 从 南极 到 北极 ， 


而 是 我 在 讲解 算法 为 何如 此 精妙 ， 


你 却 能 够 安详 在 读音 上 休 妃 。 





世界 上 最 遥远 的 距离 ， 


不 是 珠 峰 与 马里 亚 纳 海沟 的 距离 ， 


而 是 我 欲 把 古人 的 智 意 全 盘 给 你 ， 


你 却 不 导 一 顾 蝇 不 怜惜。 





世界 上 最 遥远 的 距离 ， 


不 是 牛 A 与 牛 C 之 间 狭 小 空 辽 ， 


而 是 你 们 当中 ， 


有人 在 通 往 和 牛 通 的 路上 一 路 狂 春 , 


而 有 和 人 步 入 大 学 校园 天 学 会 放弃 。 


查找 : 
査 (Searching) 束 是 根据 给 定 的 某 个 值 ， 在 查找 表 中 确定 一 个 其 关键 
字 等 于 给 定 值 的 数据 元 素 〈 或 记录 ) 。 


8.1 开场 日 


相信 在 座 的 所 有 同学 都 用 过 搜索 引擎。 那么 ， 你 知道 它 的 大 概 工作 原理 
吗 ? 


当 你 精心 制作 了 一 个 网 页 、 或 写 了 一 篇 博客 、 或 者 上 传 一 组 照片 到 互联 
网 上 ， 来 自 世 界 各 地 的 无 数 “ 蜂 蛛 * 便 会 蜂拥 而 至 。 所 谓 蜂 蛛 束 是 搜索 引 
向 公司 服务 器 上 的 软件 ， 它 如 同 蜂 蛛 一 样 把 互联 网 当成 了 蜂 蛛 网 ， 没 日 
没 夜 的 访问 互联 网 上 的 各 种 信息 。 





它 抓 取 并 复制 你 的 网 页 ， 且 通过 你 网 页 上 的 链接 息 上 更 多 的 页 面 ， 将 所 
有 信息 纳入 到 搜索 引擎 网 站 的 索引 数据 库 。 服 务 嚣 拆 解 你 网 页 上 的 文字 
内 容 、 标 记 关 键 词 的 位 置 、 字 体 、 颜 色 ， 以 及 相关 图 片 、 音 频 、 视 频 的 
位 置 等 信息 ， 并 生成 庞大 的 索引 记录 ， 如 图 8-1-1 所 示 。 








存 入 数据 库 
K 





~~ 二 网 页 分 析 ， 提 取 链 接 
链接 数据 库 页 排名 


文 检索 ， 提 取 
有 效 信息 
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索引 数据 库 


图 8-1-1 


网 站 主机 网 站 主机 






网 页 


o A 








数据 库 





当 你 在 搜索 引擎 上 输入 一 个 单词 ， 点 击 “ 搜 索 ” 按 钮 时 ， 它 会 在 不 到 1 秒 
的 时 间 ， 辜 着 单词 奔 同 索引 数据 库 的 每 个 “神经 末梢 ?， 检 索 到 所 有 包含 
搜索 词 的 网 页 ， 依 据 它们 的 浏览 次 数 与 天 联 性 等 一 系列 算法 确定 网 页 级 
别 ， 排 列 出 顺序 ， 最 终 按 你 期 望 的 格式 呈现 在 网 页 上 。 








这 就 是 一 个 “关键 词 ” 的 云端 之 旅 。 在 过 去 的 10 多 年 里 ， 成 就 了 本 世纪 最 
早期 的 创新 明星 Google， 还 有 Yandex、Navar 和 百度 等 来 自 全 球 各 地 的 
搜索 引擎 ， 搜 索引 擎 已 经 成 为 人 们 最 依赖 的 互联 网 工具 。 


作为 学 习 编 程 的 人 ， 面 对 查找 或 者 叫做 搜索 (Search) 这 种 最 为 频繁 的 
操作 ， 理 解 它 的 原理 并 学 习 应 用 它 是 非常 必要 的 事情 ， 让 我 们 开始 
对 “Search” 的 探索 之 旅 吧 。 





8.2 查找 概论 


只 要 你 打开 电脑 ， 葡 会 涉及 到 奉 找 技术 。 如 炒股 软件 中 碍 股票 信息 、 硬 
盘 文 件 中 找 照 片 、 在 光盘 中 搜 DVD， 甚 至 玩 游戏 时 在 内 存 中 查找 攻击 
力 、 魅 力 值 等 数据 修改 用 来 作 星 等 ， 痢 要 涉及 到 查找 。 当 然 ， 在 互联 网 
上 得 找 信 息 就 更 加 是 家 和 钊 便 饭 。 所 有 这 些 需 要 被 得 的 数据 所 在 的 集合 ， 
我 们 给 它 一 个 统称 叫 查 找 表 。 





ARK (Search Table) 是 由 同一 类 型 的 数据 元 素 〈《 或 记录 ) 构成 的 集 
合 。 例 如 图 8-2-1 就 是 一 个 查找 表 。 








关键 字 (Key) 是 数据 元 素 中 某 个 数据 项 的 值 ， 又 称 为 键 值 ， 用 它 可 以 
标识 一 个 数据 元 素 。 也 可 以 标识 一 个 记录 的 某 个 数据 项 〈 字 段 ) ， 我 们 
称 为 关键 码 ， 如 图 8-2-1 中 心 和 @ 上 所 示 。 





若 此 关键 字 可 以 唯一 地 标识 一 个 记录 ， 则 称 此 关键 字 为 主 关 键 字 
(Primary Key) 。 注 意 这 也 就 意味 着 ， 对 不 同 的 记录 ， 其 主 关 键 字 均 不 
相同 。 主 关键 字 所 在 的 数据 项 称 为 主 关 键 码 ， 如 图 8-2-1 中 全 和 外 所 示 。 





那么 对 于 那些 可 以 识别 多 个 数据 元 素 〈 或 记录 〉 的 关键 字 ， 我 们 称 为 次 
关键 字 (SecondaryKey) ， 如 图 8-2-1 中 @@ 所 示 。 次 关键 字 也 可 以 理解 为 
是 不 以 唯一 标识 一 个 数据 元 素 〈 或 记录 ) 的 关键 字 ， 它 对 应 的 数据 项 就 
是 次 关键 码 。 


OEREN 


OERREF 


一 全 数据 项 【学 段 ) 


OU 
RAR Dah ES) 
12.88 12. 68/12 69 391308 


“0. 06 





人 0 数据 元 素 ( 记 录 ) 一 


-0.05 


3.45 3. 45/3. 46 194203 
14.52 “0.24 34. 52/14. 54 385271 
ê. 10 =0. 68 ê. 08/6. 20 347837 


35. 22/15. 23 597025 


“0.42 





图 8-2-1 


=0. 04 


25.83 25.61/25. 63 86666 
63.23 +0. 80 63. 23/63. 39 153700 
7.21 =0.13 7.21/7.22 211077 
11.24 -0.27 31. 22/11. 24 156162 
3.01 -0.17 9. 00/8. 01 542249 





AER (Searching) 就 是 根据 给 定 的 某 个 值 ， 在 查 


找 表 中 确定 一 个 其 关键 字 等 于 给 定 值 的 数据 元 素 


《或 记录 ) 。 


耕 表 中 存在 这 样 的 一 个 记录 ， 则 和 


尔 查 找 是 成 功 的 ， 此 时 查找 的 结果 给 出 


整个 记录 的 信息 ， 或 指示 该 记录 在 查找 表 中 的 位 置 。 比 如 图 8-2-1 所 示 ， 
如 果 我 们 碍 找 主 关键 码 “ 代 码 ” 的 主 关键 字 为 “sh601398” 的 记录 时 ， 就 可 


以 得 到 第 
录 时 ， 就 可 以 得 到 两 条 记录 。 





2 条 唯一 记录 。 如 果 我 们 查找 次 关键 码 “ 涨 跌 额 ”为 “-0.11” 的 记 





若 表 中 不 存在 关键 字 等 于 给 定 值 的 记录 ， 则 称 查找 不 成 功 ， 此 时 查找 的 
结果 可 给 出 一 个 “ 空 ”记录 或 “ 空 ”指针 。 








查找 表 按 照 操作 方式 来 分 有 两 大 种 : 静态 查找 表 和 动态 查找 表 。 


静态 查找 表 (Static Search Table) : 只 作 查 找 操 作 的 查找 表 。 它 的 主要 
操作 有 : (1〉 查 询 某 个 “特定 的 ”数据 元 素 是 否 在 查找 表 中 。 (2) 检索 
某 个 “特定 的 ”数据 元 素 和 各 种 属性 。 











按照 我 们 大 多 数 人 的 理解 ， 查 找 ， 当 然 是 在 已 经 有 的 数据 中 找到 我 们 雷 
要 的 。 静 态 碍 找 就 是 在 干 这 样 的 事情 ， 不 过 ， 现 实 中 还 有 存在 这 样 的 应 
H: 碍 找 的 目的 不 仅仅 只 是 查找 。 











比如 网 络 时 代 的 新 名 词 ， 如 反应 年 轻 人 生活 的 “ 蜗 届 ”“ 蚁 族 ” FR 
奴 ”“ 哨 老 ” 等 ， 以 及 “X 客 ?系列 如 博客 、 播 客 、 内 客 、 黑 客 、 威 客 等 ， 
如 果 需 要 将 它们 收录 到 汉语 词典 中 ， 显 然 收 录 时 就 需要 但 找 它 们 是 否 存 
在 ， 以 及 找到 如 果 不 存在 时 应 该 收录 的 位 置 。 再 比如 ， 如 果 你 需要 对 茶 
网 站 上 亿 的 注册 用 户 进行 清理 工作 ， 注 销 一 些 非 法 用 户 ， 你 就 需 查 找到 
它们 后 进行 和 删除， 删除 后 其 实 整个 伍 找 表 也 会 发 生变 化 。 对 于 这 样 的 应 
用 ， 我 们 就 引入 了 动态 查找 表 。 














动态 查找 表 (Dynamic Search Table) : 在 查找 过 程 中 同时 插入 查找 表 中 
不 存在 的 数据 元 系 ， 或 者 从 碍 找 表 中 删除 已 经 存在 的 茶 个 数据 元 素 。 显 
然 动态 查找 表 的 操作 就 是 两 个 : (1) 查找 时 插入 数据 元 素 。 (2) 查找 
时 删除 数据 元 素 。 








为 了 提高 查找 的 效率 ， 我 们 需要 专门 为 查找 操作 设置 数据 结构 ， 这 种 面 
向 查找 操作 的 数据 结构 称 为 查找 结构 。 





从 逻辑 上 来 说 ， 但 找 所 基于 的 数据 结构 是 集合 ， 集 合 中 的 记录 之 间 没 有 
本 质 关 系 。 可 是 要 想 获 得 较 高 的 查找 性 能 ， 我 们 就 不 能 不 改变 数据 元 素 
之 间 的 关系 ， 在 存储 时 可 以 将 查找 集合 组 织 成 表 、 树 等 结构 。 





例如 ， 对 于 静态 碍 找 表 来 说 ， 我 们 不 妨 应 用 线性 表 结 构 来 组 织 数据 ， 这 
样 可 以 使 用 顺序 碍 找 算法 ， 如 果 再 对 主 关键 字 排 序 ， 则 可 以 应 用 折 半 碍 
找 等 技术 进行 高 效 的 碍 找 。 








IA 





另外 ， 还 可 以 用 散 列 表 纺 构 来 解决 一 些 查 找 问题 ， 这 些 技术 都 将 在 后 面 
的 讲解 中 说 明 。 


8.3 ”顺序 表 查 找 


试想 一 下 ， 要 在 散落 的 一 大 扒 书 中 找到 你 需要 的 那 本 有 多 么 麻烦 。 碰 到 
这 种 情况 的 人 大 都 会 考 钳 做 一 件 事 ， 那 就 是 把 这 些 书 排列 整齐 ， 比 如 坚 
UMS are 
8-3-1 所 示 。 
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图 8-3-1 


散落 的 图 书 可 以 理解 为 一 个 集合 ， 而 将 它们 排列 整 章 ， 就 如 同 是 将 此 集 
合 构造 成 一 个 线性 表 。 我 们 要 针对 这 一 线性 表 进 行 查 找 操 作 ， 因 此 它 就 
是 静态 查找 表 。 








此 时 图 书 尽管 已 经 排列 整齐 ， 但 还 没有 分 类 ， 因 此 我 们 要 找 书 只 能 从 头 
到 尾 或 从 尾 到 头 一 本 一 本 查看， 直到 找到 或 全 部 查找 完 为 上 上。 这 就 是 我 
们 现在 要 讲 的 顺序 查找 。 





顺序 查找 (Sequential Search) 又 叫 线性 查找 ， 是 最 基本 的 查找 技术 ， 写 
的 查找 过 程 是 : 从 表 中 第 一 个 (或 最 后 一 个 ) 记录 开始 ， 逐 个 进行 记录 








的 关键 字 和 给 定 值 比较 ， 寿 菜 个 记录 的 关键 字 和 给 定 值 相 等 ， 则 查找 成 
功 ， 找 到 所 碍 的 记录 ; WRAP RIS GRD) 记录 ， 其 关键 字 
和 给 定 值 比较 都 不 等 时 ， 则 表 中 没有 所 碍 的 记录 ， 碍 找 不 成 功 。 





8.3.1 ”顺序 表 查 找 算法 


顺序 碍 找 的 算法 实现 如 下 。 





/* 顺序 查找 ，a 为 数组 ，n 为 要 查找 的 数组 长 度 ， 
key 为 要 查找 的 关键 字 */ 


int Sequential Search(int *a, int n, int key) 





te 
roie (le nl 
if (a[i] == key) 
return i; 
return 0; 
J 


这 段 代 码 非常 简单 ， 就 是 在 数组 a《〈 注 意 元 素 值 从 下 标 1 开始 ) 中 查看 有 
MA REF (key) ， 当 你 需要 碍 找 复 杂 表 络 构 的 记录 时 ， 只 需要 把 数 
组 a 与 关键 字 key 定 义 成 你 需要 的 表 结 构 和 数据 类 型 即 可 。 














8.3.2 ”顺序 表 查 找 优 化 


到 这 里 并 非 足 够 完美 ， 因 为 每 次 循环 时 都 需要 对 i 是 否 越 界 ， 即 是 否 小 
于 等 于 n 作 判断 。 事 实 上， 还 可 以 有 更 好 一 点 的 办 法 ， 设 置 一 个 哨兵 ， 

可 以 解决 不 需要 每 次 让 i 与 n 作 比较 。 看 下 面 的 改进 后 的 顺序 查找 算法 代 
码 。 











/* 有 哨兵 顺序 查找 */ 
int Sequential_Search2(int *a, int n, int key) 














mR 
/* 设置 a[9] 为 关键 字 值 ， 我 们 称 之 为 “哨兵 ” */ 
a[9] = key: 





/* 循环 从 数组 尾部 开始 */ 





i=n; 
while (a[i] != key) 


ュー 
} 
/* 返回 0 则 说 明 查 找 失 败 */ 
return i; 


} 





此 时 代码 是 从 尾部 开始 查找 ， 由 于 a[0]=key， 也 就 是 说 ， 如 果 在 a[i 中 有 
key 则 返回 i 值 ， 查 找 成 功 。 人 否则 一 定 在 最 终 的 a[0] 处 等 于 key， 此 时 返回 
的 是 0， 即 说 明 a[1]~a[ln] 中 没有 关键 字 key， 查 找 失 败 。 








这 种 在 查找 方向 的 尽头 放置 "哨兵 " 免 去 了 在 查找 过 程 中 每 一 次 比较 后 都 
要 判断 查找 位 置 是 否 越界 的 小 技巧 ， 看 似 与 原先 差别 不 大 ， 但 在 总 数据 
较 多 时 ， 效 率 提高 很 大 ， 是 非常 好 的 编码 技巧 。 当 然 ，“ 哨 兵 " 也 不 一 定 
就 一 定 要 在 数组 开始 ， 也 可 以 在 末端 。 

















对 于 这 种 顺序 得 找 算 法 来 说 ， 碍 找 成 功 最 好 的 情况 就 是 在 第 一 个 位 置 束 
找到 了 ， 算 法 时 间 复 杂 度 为 0(1)， 最 坏 的 情况 是 在 最 后 一 位 置 才 找到 ， 
需要 n 次 比较 ， 时 间 复 杂 上 度 为 0Im， 当 得 找 不 成 功 时 ， 需 要 n+1 次 比较 ， 
时 间 复 杂 度 为 0m)。 我 们 之 前 推导 过 ， 关 键 字 在 任何 一 位 置 的 概率 是 相 
同 的 ， 所 以 平均 查找 次 数 为 (n+1)/2， 所 以 最 终 时 间 复 杂 度 还 是 O(n)。 




















很 显然 ， 有 顺序 奏 找 技术 是 有 很 大 缺点 的 ，n 很 大 时 ， 碍 找 效率 极为 低 
下 ， 不 过 优点 也 是 有 的 ， 这 个 算法 非常 简单 ， 对 静态 查找 表 的 记录 没有 
任何 要 求 ， 在 一 些小 型 数据 的 查找 时 ， 是 可 以 适用 的 。 








另外 ， 也 正 由 于 碍 找 概率 的 不 同 ， 我 们 完全 可 以 将 容易 查找 到 的 记录 放 
在 前 面 ， 而 不 常用 的 记录 放置 在 后 面 ， 效 紊 就 可 以 有 大 幅 提 高 。 





8.4 有 序 表 碍 找 


我 们 如 果 仅 仅 是 把 书 整理 在 书架 上 ， 要 找到 一 本 书 还 是 比较 困难 的 ， 也 
就 是 刚才 讲 的 需要 逐个 顺序 查找。 但 如 果 我 们 在 整理 书架 时 ， 将 图 书 按 
照 书 名 的 拼音 排序 放置 ， 那 么 要 找到 茶 一 本 书 惑 相对 容易 了 。 访 白 了 ， 

~ 图 书 做 了 有 序 排列 ， 一 个 线性 表 有 序 时 ， 对 于 碍 找 总 是 很 有 帮助 


8.4.1 折 半 查找 


我 们 在 讲 树 结构 的 三 叉 树 定义 (本 书 第 6.5 节 〉 时 ， 曾 经 提 到 过 一 个 小 
游戏 ， 我 在 纸 上 已 经 写 好 了 一 个 100 以 内 的 正 整 数 数字 请 你 猜 ， 问 几 次 
可 以 猿 出 来 ， 当 时 已 经 介绍 了 如 何 最 快 猿 出 这 个 数字 。 我 们 把 这 种 每 次 
取 中 间 记 录 查 找 的 方法 叫做 折 半 查找 ， 如 图 8-4-1 所 示 。 


79 @ @ 


Nn 7 > 7 


0009066 


折 半 查找 (Binary Search) 技术 ， 叉 称 为 二 分 查找 。 它 的 前 提 是 线性 表 
中 的 记录 必须 是 关键 码 有 序 (通常 从 小 到 大 有 序 ) ， 线 性 表 必 须 采 用 顺 


图 8-4-1 








序 存储 。 折 半 碍 找 的 基本 思想 是 : 在 有 序 表 中 ， 取 中 间 记 录 作 为 比较 对 
象 ， 各 给 定 值 与 中 间 记 录 的 关键 字 相 等 ， 则 碍 找 成 功 ， 知 给 定 值 小 于 中 
间 记 录 的 关键 子 ， 则 在 中 间 记 录 的 左 半 区 继续 查找 ， 夺 给 定 值 大 于 中 间 
记录 的 关键 字 ， 则 在 中 间 记 录 的 右 半 区 继续 查找 。 不 断 重 复 上 述 过 程 ， 
直到 查找 成 功 ， 或 所 有 但 找 区 域 无 记录 ， 查 找 失败 为 止 。 











假设 我 们 现在 有 这 样 一 个 有 序 表 数 组 {0,1,16,24,35,47,59,62,73,88,99}， 
除 0 下 标 外 共 10 个 数字 。 对 它 进行 查找 是 否 存 在 62 这 个 数 。 我 们 来 看 折 
半 查 找 的 算法 是 如 何 工 作 的 。 





/* 折 半 查找 */ 
int Binary_Search(int *a, int n, int key) 
{ 
int low, high, mid; 
Ee 定义 最 低 标 为 记录 首位 */ 
low = 1; 
/* 定义 最 高 标 为 记录 末 位 */ 
high = n; 
while (low <= high) 






































/* 折半 */ 

mid = (low + high) / 2; 

/* 若 查 找 值 比 中 值 小 */ 

if (key < a[mid] ) 
/* 最 高 下 标 调整 到 中 位 下 标 小 一 位 */ 
high = mid - 1; 

/* 若 查 找 值 比 中 值 大 */ 

else if (key > a[mid]) 
/* 最 低下 标 调整 到 中 位 下 标 大 一 位 */ 
low = mid + 1; 

else 
/* 若 相等 则 说 明 mid 即 为 查找 到 的 位 置 */ 


return mid; 




































































} 


return 0; 


1. 程序 开始 运行 ， 参数 a={0,1,16,24,35,47,59,62,73,88,99}，n=10， 
key=62, 第 3 一 5 行 , 此 時 low=1, high=10, 如 図 8-4-2 所 示 。 
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2. 第 6 一 15 行 循环 ， 进 行 得 找 。 


图 8-4-2 


3. 第 8 行 ，mid 计 算得 5， ME =47<key， 所 以 执行 了 第 12 行 ， 
low=5+1=6， 如 图 8-4-3 所 示 
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图 8-4-3 


4. 再 次 循环 ，mid=(6+10)/2=8， 此 时 a[8]=73>key， 所 以 执行 第 10 行 ， 
high=8-1=7， 如 图 8-4-4 所 示 。 
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5. 再 次 循环 ，mid=(6+7)/2=6， 此 时 a[6]=59<key， 所 以 执行 12 行 ， 
low=6+1=7， 如 网 8-4-5 所 示 。 





图 8-4-4 
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图 8-4-5 
6. 再 次 循环 ，mid=(7+7)/2=7， 此 时 a[7]=62=key， 查 找 成 功 ， 返 回 7。 


该 算法 还 是 比较 容易 理解 的 ， 同 时 我 们 也 能 感觉 到 它 的 效率 非 第 高 。 但 
到 底 高 多 少 ? 关键 在 于 此 算法 的 时 间 复 杂 度 分 析 。 


首先 ， 我 们 将 这 个 数组 的 查找 过 程 绘制 成 一 棵 二 叉 树 ， 如 图 8-4-6 所 示 ， 
从 图 上 就 可 以 理解 ， 如 果 查 找 的 关键 字 不 是 中 间 记 录 47 的 话 ， 折 半 查 找 
等 于 是 把 静态 有 序 查 找 表 分 成 了 两 棵 子 树 ， 即 查找 结果 只 需要 找 其 中 的 
一 半数 据 记 录 即 可 ， 等 于 工作 量 少 了 一 半 ， 然 后 继续 折 半 查找 ， 效 率 当 
然 是 非常 高 了 。 











图 8-4-6 





我 们 之 前 6.6 讲 的 二 又 树 的 性 质 4， 有 过 对 “具有 n 个 结 点 的 完全 二 又 树 
的 深度 为 。” 性 质 的 推导 过 程 。 在 这 里 尽管 折 半 奉 找 判定 二 又 树 并 不 是 
完全 二 又 树 ， 但 同样 相同 的 推导 可 以 得 出 ， 最 坏 情 况 是 碍 找到 关键 字 或 
查找 失败 的 次 数 为 。 





有 人 还 在 问 最 好 的 情况 ? 那 还 用 说 吗 ， 当 然 是 1 次 了 。 





因此 最 终 我 们 扩 半 算法 的 时 间 复 杂 度 为 OQogn)， 它 显然 远 远 好 于 顺序 盘 
FRA O(n) IN Ta] 32 AR BE T 
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表 ， 一 次 排序 后 不 再 变化 ， 这 样 的 算法 已 经 比较 好 了 。 但 对 于 需要 频繁 
执行 插入 或 删除 操作 的 数据 集 来 说 ， 维 护 有 序 的 排序 会 带 来 不 小 的 工作 
量 ， 那 就 不 建议 使 用 。 








8.4.2 ”插值 查找 


为 什么 一 定 要 折 半 ， 而 不 是 折 四 分 之 一 或 者 折 更 
呢 ? 


打 个 比方 ， 在 英文 词典 里 奋 “apple”， 你 下 意识 里 翻 开 词 典 是 翻 前 面 的 书 
页 还 是 后 面 的 书页 呢 ? 如 果 再 让 你 得 “zoo”， 你 又 怎么 得 ? REA, X 
里 你 绝对 不 会 是 从 中 间 开 始 奋起 ， 而 是 有 一 定 目的 的 往 前 或 往 后 翻 。 





图 8-4-7 


同样 的 ， 比 如 要 在 取 值 范围 0 一 10000 之 间 100 个 元 素 从 小 到 大 均匀 分 布 
的 数组 中 查找 5， 我 们 自然 会 考虑 从 数组 下 标 较 小 的 开始 查找 。 


看 来 ， 我 们 的 折 半 得 找 ， 还 是 有 改进 空间 的 。 


折 半 查找 代码 的 第 8 句 ， 我 们 略微 等 式 变换 后 得 到 : 











也 束 是 mid 等 于 最 低下 标 low 加 上 最 高 下 标 high 与 ow 的 差 的 一 半 。 算 法 
科学 家 们 考虑 的 就 是 将 这 个 1/2 进 行 改进 ， 改 进 为 下 面 的 计算 方案 : 





key -a low 
a\high |- allow 


将 12 改 成 了 (key-a[low])/(a[high]-a[low]) 有 什么 道理 呢 ? 假设 a[11]= 
{0,1,16,24,35,47,59,62,73,88,99}，low=1，high=10， 则 a[low]=1， 
a[fhigh]=99， 如 果 我 们 要 找 的 是 key=16 时 ， 按 原来 折 半 的 做 法 ， 我 们 需 
要 四 次 (如 图 8-4-6) 才 可 以 得 到 结果 ， 但 如 果 用 新 办 法 ，(key- 
allow])/(a[high]-allow])=(16-1)/(99-1)S0.153, 即 mids1+0.153x(10- 
1)=2.377 取 整 得 到 mid=2， 我 们 只 需要 二 次 就 查找 到 结果 了 ， 显 然 大 大 
提高 了 查找 的 效率 。 


mid = low + (high - low] 








换 句 话说 ， 我 们 只 需要 在 折 半 查找 算法 的 代码 中 更 改 一 下 第 8 行 代码 如 
F: 


mid=low+ (high-low)*(key-a[low])/(a[high]-a[low]); /* 插值 */ 





就 得 到 了 另 一 种 有 序 表 得 找 算法 ， 插 值得 找 法 。 插 值得 找 〈Interpolation 
Search) 是 根据 要 查找 的 关键 字 key 与 查找 表 中 最 大 最 小 记录 的 关键 字 比 
较 后 的 查找 方法 ， 其 核心 就 在 于 插值 的 计算 公式 (key-allow])/(a[high]- 
a[low])。 应 该 说 ， 从 时 间 复 杂 上 度 来 看 ， 它 也 是 OQogn)， 但 对 于 表 长 较 
大 ， 而 关键 字 分 布 又 比较 均匀 的 查找 表 来 说 ， 插 值 查 找 算法 的 平均 性 能 
比 折 半 查 找 要 好 得 多 。 反 之 ， 数 组 中 如 果 分 布 类 似 
{0,1,2,2000,2001,.…..,999998,999999} 这 种 极端 不 均匀 的 数据 ， 用 插值 查 
找 未 必 是 很 合适 的 选择 。 


























8.4.3 SEyR ASIA 


还 有 没有 其 他 办 法 ? 我 们 折 半 查找 是 从 中 间 分 ， 也 就 是 说 ， 每 一 次 查找 
总 是 一 分 为 二 ， 无 论 数据 偏 大 还 是 偏 小 ， 很 多 时 候 这 都 未 必 束 是 最 合理 
的 做 法 。 除 了 插值 查找 ， 我 们 再 介绍 一 种 有 序 查 找 ， 斐 波 那 契 碍 找 
(Fibonacci Search) ， 它 是 利用 了 黄金 分 割 原 理 来 实现 的 。 





裴 波 那 契 数列 我 们 在 前 面 4.8 节 讲 递归 时 ， 也 详细 地 介绍 了 它 。 如 何 利 
用 这 个 数列 来 作为 分 割 呢 ? 


为 了 能 够 介绍 清楚 这 个 查找 算法 ， 我 们 先 需 要 有 一 个 斐 波 那 契 数列 的 数 
组 ， 如 图 8-4-8 所 示 。 
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图 8-4-8 








下 面 我 们 根据 代码 来 看 程序 是 如 何 运 行 的 。 





/* 斐 波 那 契 查找 */ 
int Fibonacci_Search(int *a, int n, int key) 





ant lows hagh? mc ke 








/* 定 义 最 低下 标 为 记录 首位 */ 

















/* 定 义 最 高 下 标 为 记录 末 位 */ 








Fs EnF SEAS HC a7 
while (n > F[k] - 1) 
k++; 
/* 将 不 满 的 数值 补 全 */ 
ier (Gh te. ays EI} ee Sls Sige) 
afi] = a[n]; 
while (low <= high) 














































































































{ 
/* 计算 当前 分 隔 的 下 标 */ 
mid = low + F[k - 1] - 1; 
/* 若 查 找 记录 小 于 当前 分 隔 记录 */ 
if (key < a[mid] ) 
/* 最 高 下 标 调整 到 分 隔 下 标 mid-1 处 */ 
high = mid - 1; 
/* 斐 波 那 契 数列 下 标 减 一 位 */ 
k=k- 1; 
is 
/* 若 查 找 记录 大 于 当前 分 隔 记录 */ 
else if (key > a[mid]) 
{ 
/* 最 低下 标 调整 到 分 隔 下 标 mid+1 处 */ 
low = mid + 1; 
/* 斐 波 那 契 数列 下 标 减 两 位 */ 
k =k - 2; 
+ 
else 
if (mid <= n) 
/* 若 相等 则 说 明 mid 即 为 查找 到 的 位 置 */ 
return mid; 
else 
/* 若 mid>n 说 明 是 补 全 数值 ， 返 回 n */ 
return n; 
zr 
} 
return 0; 


1. 程序 开始 运行 ， 参 数 a={0,1,16,24,35,47,59,62,73,88,99}，n=10， 要 查 
找 的 关键 字 key= 59。 注意 此 时 我 们 已 经 有 了 事先 计算 好 的 全 局 变量 数组 
FE 的 具体 数据 ， 它 是 斐 波 那 契 数列 ，EF={0,1,1,2,3,5,8,13,21,.…} 。 
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图 8-4-9 


2. 第 6 一 8 行 是 计算 当前 的 n 处 于 辈 波 那 契 数列 的 位 置 。 现 在 n=10，F[6] 
<n<F[7]， 所 以 计算 得 出 k=7。 


3. 第 9 一 10 行 ， 由 于 k=7， 计 算 时 是 以 F[7]=13 为 基础 ， 而 a 中 最 大 的 仅 
是 a[10]， 后 面 的 a[11]，a[12] 均 未 赋值 ， 这 不 能 构成 有 序数 列 ， 因 此 将 
它们 都 赋值 为 最 大 的 数组 值 ， 所 以 此 时 a[11]=a[12]=a[10]=99〈 此 段 代码 
作用 后 面 还 有 解释 ) 。 


4. 第 11 一 31 行 查找 正式 开始 。 


5. 第 13 行 ，mid=1 十 F[7-1]-1=8， 也 就 是 说 ， 我 们 第 一 个 要 对 比 的 数值 
是 从 下 标 为 8 开始 的 。 


6. 由 于 此 时 key=59 而 a[8]=73， 因 此 执行 第 16 一 17 行 ， 得 到 high=7， 
k=6。 
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图 8-4-10 


7. 再 次 循环 ，mid=1 十 F[6-1]-1=5。 此 时 a[5]=47<key， 因 此 执行 第 21 一 
22 行 ， 得 到 low=6，k=6-2=4。 注 意 此 时 k 下 调 2 个 单位 。 





图 8-4-11 


8. 再 次 循环 ，mid=6 十 F[4-1]-1=7。 此 时 a[7]=62>key， 因 此 执行 第 16~ 
17 行 ， 得 到 high=6，k=4-1=3。 
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图 8-4-12 


9. 再 次 循环 ，mid=6 十 F[3-1]-1=6。 此 时 a[6]=59=key， 因 此 执行 第 26~ 
27 行 ， 得 到 返回 值 为 6。 程 序 运行 结束 。 








如 果 key=99， 此 时 查找 循环 第 一 次 时 ，mid=8 与 上 例 是 相同 的 ， 第 二 次 
循环 时 ，mid=11， 如 果 a[11] 没 有 值 就 会 使 得 与 key 的 比较 失败 ， 为 了 避 
免 这 样 的 情况 出 现 ， 第 9 一 10 行 的 代码 就 起 到 这 样 的 作用 。 





裴 疲 那 契 奉 找 算法 的 核心 在 于 : 


1) 当 key=a[mid] 时 ， 查 找 束 成 功 ; 

2) 当 key<a[mid] 时 ， 新 范围 是 第 low 个 到 第 mid-1 个 ， 此 时 范围 个 数 为 
F[k-1]-1 个 ; 

3) 当 key>a[mid] 时 ， 新 范围 是 第 m+1 个 到 第 high 个 ， 此 时 范围 个 数 为 
F[k-2]-1 个 。 


Fk} 





low mid high 
F[k-1]-] Fik-2]-1 
图 8-4-13 


也 就 是 说 ， 如 果 要 僵 找 的 记录 在 右 侧 ， 则 左 侧 的 数据 都 不 用 再 判断 了 ， 
不 断 反 复 进行 下 去 ， 对 处 于 当中 的 大 部 分 数据 ， 其 工作 效率 要 高 一 些 。 
所 以 尽管 裴 波 那 外 碍 找 的 时 间 复 杂 也 为 Oogn)， 但 就 平均 性 能 来 说 ， 裴 
波 那 契 奉 找 要 优 于 折 半 得 找 。 可 惜 如 果 是 最 坏 情况 ， 比 如 这 里 key=1， 

那么 始终 都 处 于 左 侧 长 半 区 在 查找 ， 则 查找 效率 要 低 于 折 半 仁 找 。 


还 有 比较 关键 的 一 点 ， 折 半 查 找 是 进行 加 法 与 除法 运算 (mid=(low 十 
high)/2) ， 插 值 查 找 进行 复杂 的 四 则 运算 (mid=low 十 (high-low)*(key- 
allow])/(a[high]-allow]) ) ， 而 辈 波 那 契 查找 只 是 最 简单 加 减法 运算 
(mid=low+F[k-1]-1) ， 在 海量 数据 的 查找 过 程 中 ， 这 种 细微 的 差别 可 
能 会 影响 最 终 的 查找 效率 。 


应 该 说 ， 三 种 有 序 表 的 查找 本 质 上 有 是 分 隔 点 的 选择 不 同 ， 各 有 优 劣 ， 实 
际 开发 时 可 根据 数据 的 特点 综合 考虑 再 做 出 选择 。 





8.5 ”线性 索引 查找 











我 们 前 面 讲 的 几 种 比较 高 效 的 查找 方法 都 是 基于 有 序 的 基础 之 上 的 ， 但 
事实 上 ， 很 多 数据 集 可 能 增长 非常 快 ， 例 如 ， 茶 些微 博 网 站 或 大 型 论坛 
的 帖子 和 回复 总 数 每 天 都 是 成 百 万 上 于 万 条 ， 如 图 8-5-1 所 示 ， 或 者 一 些 
服务 器 的 日 志 信 息 记 录 也 可 能 是 海量 数据 ， 要 保证 记录 全 部 是 按照 当中 
的 茶 个 关键 字 有 序 ， 其 时 间 代 价 是 非常 高 郧 的 ， 所 以 这 种 数据 通 音 都 是 
按 先后 顺序 存储 。 














Twitter 每 日 从 情 数 达 9 干 万 话题 多 与 电视 相关 
RIBA ltwnter RAF 2010-11-11 11:14 HEO ALAR 由夏 [收藏 


北京 时 间 11 月 11 日 消息 ，TWitter 高 管 罗 宾 , 其 隆 (Robin Sloan) 今日 在 旧金山 举行 的 
NeWTeeVee 会 以 中 请 露 ，Twitter 拇 日 微 博 数量 已 达 9000 万 条 ， 其 中 绝 大 部 分 短 情 话题 与 电视 相 
$o 


图 8-5-1 


0 ii 22 我 们 如 何 能 够 快速 查找 到 需要 的 数据 昵 ? 办 法 
fJe—_ RG 











数据 结构 的 最 终 目 的 是 提高 数据 的 处 理 速度 ， 索 引 是 为 了 加 快 查 找 速度 
而 设计 的 一 种 数据 结构 。 索 引 就 是 把 一 个 关键 字 与 它 对 应 的 记录 相关 联 
的 过 程 ， 一 个 索引 由 奋 干 个 罕 引 项 构成 ， 每 个 索引 项 至 少 应 包含 关键 字 
和 其 对 应 的 记录 在 存储 器 中 的 位 置 等 信息 。 索 引 技术 是 组 织 大 型 数据 库 
以 及 磁盘 文件 的 一 种 重要 技术 。 




















索引 按照 结构 可 以 分 为 线性 宗 引 、 树 形 索 引 和 多 级 索引 。 我 们 这 里 就 只 
介绍 线性 索引 技术 。 所 谓 线 性 索引 就 是 将 索引 项 集合 组 织 为 线性 结构 ， 
Bee ele eda eee ee 
ERIL 





8.5.1 稠密 索引 





我 母亲 年 纪 大 了 ， 记 忆 力 不 好 ， 经 音 在 家 里 找 不 到 东西 ， 于 是 她 想到 了 
一 个 办 法 。 她 用 一 小 本 子 记 录 了 家 里 所 有 小 东西 放置 的 位 置 ， 比 如 户口 
本 放 在 右手 床头柜 下 面 抽 导 中， 针线 放 在 电视 柜 中 间 的 抽 导 中， 钞票 放 
FEARS... MK, PMA GES CMA) 。 总 之 ， 她 老人 家 把 这 些 
小 物品 的 放置 位 置 都 记录 在 了 小 本 子 上 ， 并 且 每 隅 一 段 时 间 还 按照 本 子 
整理 一 饥 家 中 的 物品 ， 用 完 都 放 回 原 处 ， 这 样 她 就 几乎 再 没有 找 不 到 东 
西 。 








记得 有 一 次 我 申请 职称 时 ， 单 位 一 定 要 我 的 大 学 毕业 证 ， 我 在 家 里 找 了 
很 长 时 间 未 果 ， 急 得 要 死 。 和 老 妈 一 说 ， 她 的 神奇 小 本 子 瑟 上 发 挥 作 
用 ， 一 下 了 就 找到 了 ， 原 来 被 她 整理 后 放 到 了 衣 橱 里 的 抽 屠 里 。 


从 这 件 事 就 可 以 看 出 ， 家 中 的 物品 尽管 是 无 序 的 ， 但 是 如 果 有 一 个 小 本 
子 记录 ， 寻 找 起 来 也 是 非常 容易 ， 而 这 小 本 子 惑 是 索引 。 











稠密 索引 是 指 在 线性 索引 中 ， 将 数据 集中 的 每 个 记录 对 应 一 个 索引 项 ， 
如 图 8-5-2 所 示 。 


大 键 码 其 他 数据 项 
下 标 关键 码 指针 
aj e 
JOE 
Tel) elhe 
aE, Ce 
加 了 e 


图 8-5-2 


刚才 的 小 例子 和 稠密 索引 还 是 略 有 不 同 ， 家 里 的 东西 毕竟 少 ， 小 本 子 再 
多 也 束 儿 十 页 ， 全 部 翻 看 完 就 儿 分 钟 时 间 ， 而 稠密 索引 要 应 对 的 可 能 是 
成 千 上 万 的 数据 ， 因 此 对 于 稠密 索引 这 个 索引 表 来 说 ， 索 引 项 一 定 是 按 
照 天 键 码 有 序 的 排列 。 

















索引 项 有 序 也 束 意 味 厦 ， 我 们 要 会 找 关键 字 时 ， 可 以 用 到 折 半 、 插 值 、 
斐 波 那 契 等 有 序 公 找 算法 ， 大 大 提高 了 效率 。 比 如 图 8-5-2 中 ， 我 要 查找 


KETEL WRARMNA MBH HK, IR HEM 
找 ， 需 要 查找 6 次 才 可 以 查 到 结果 。 而 如 果 是 从 左 侧 的 索引 表 中 查找 ， 
只 需 两 次 折 半 查找 就 可 以 得 到 18 对 应 的 指针 ， 最 终 查 找到 结果 。 





这 显然 是 稠密 索引 优点 ， 但 是 如 打数 据 集 非 常 大 ， 比 如 上 亿 ， 那 也 就 意 
味 着 索引 也 得 同样 的 数据 集 长 上 度 规模 ， 对 于 内 存 有 限 的 计算 机 来 说 ， 可 
能 就 需要 反复 去 访问 磁盘 ， 碍 找 性 能 反而 大 大 下 降 了 。 





8.5.2 ”分 块 索引 


回想 一 下 图 书馆 是 如 何 藏书 的 。 显 然 它 不 会 是 顺序 摆 放 后 ， 给 我 们 一 个 
稠密 索引 表 去 得 ， 然 后 再 找到 书 给 你 。 图 书馆 的 图 书 分 类 摆 放 是 一 门 非 
常 完整 的 科学 体系 ， 而 它 节 重要 的 一 个 特点 驶 是 分 块 。 








图 8-5-3 








稠密 索引 因为 索引 项 与 数据 集 的 记录 个 数 相同 ， 所 以 空间 代价 很 大 。 为 
了 减少 索引 项 的 个 数 ， 我 们 可 以 对 数据 集 进 行 分 块 ， 使 其 分 其 有 序 ， 然 
后 再 对 每 一 块 建立 一 个 索引 项 ， 从 而 减少 过 引 项 的 个 数 。 


R 


oe 是 把 数据 集 的 记录 分 成 了 大 干 块 ， 并 且 这 些 块 需 要 满足 两 个 


N 


块 内 无 序 ， 即 每 一 块 内 的 记录 不 要 求 有 序 。 当 然 ， 你 如 果 能 够 让 块 
内 有 序 对 查找 来 说 更 理想 ， 不 过 这 束 要 付出 大 量 时间 和 空间 的 代 
价 ， 因 此 通 第 我 们 不 要 求 块 内 有 了 订 。 

块 间 有 序 ， 例 如 ， 要 求 第 二 块 所 有 记录 的 关键 字 均 要 大 于 第 一 块 中 
所 有 记录 的 关键 字 ， 第 三 块 的 所 有 记录 的 关键 字 均 要 大 于 第 二 块 的 
TS pi 因为 只 有 块 间 有 序 ， 才 有 可 能 在 查找 时 带 来 效 








对 于 分 块 有 序 的 数据 集 ， 将 每 块 对 应 一 个 索引 项 ， 这 种 索引 方法 叫做 分 
EA 0 
SN: 





。 最 大 关键 码 ， 它 存储 每 一 块 中 的 最 大 关键 字 ， 这 样 的 好 处 就 是 可 以 
ee eer deer net Ae 


TANS 

。 存储 了 块 中 的 记录 个 数 ， 以 便于 循环 时 使 用 ; 

e alga ieee ee ne rele ee aioe 
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图 8-5-4 
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1. 在 分 块 索引 表 中 得 找 要 碍 关键 字 所 在 的 块 。 由 于 分 块 索引 表 是 块 间 有 
序 的 ， 因 此 很 容易 利用 折 半 、 插 值 等 算法 得 到 结果 。 例 如 ， 在 图 8-5-4 的 
数据 集中 查找 62， 我 们 可 以 很 快 可 以 从 左上 角 的 索引 表 中 由 57<62<96 得 
到 62 在 第 三 个 块 中 。 

2. 根 据 块 首 指针 找到 相应 的 块 ， 并 在 块 中 顺序 查找 关键 码 。 因 为 块 中 可 
以 是 无 序 的 ， 因 此 只 能 顺序 查找 。 








应 该 说 ， 分 块 索引 的 思想 是 很 容易 理解 的 ， 我 们 通常 在 整理 书架 时 ， 都 
会 考虑 不 同 的 层 板 放置 不 同类 别 的 图 书 。 例 如 ， 我 家 里 就 是 最 上 层 放 不 
太 常 翻阅 的 小 说 书 ， 中 间 层 放 经 常用 到 的 如 菜谱 、 了 字典 等 生活 和 工具 用 
书 ， 最 下 层 放 大 开本 比较 重 的 计算 机 书 。 这 就 是 分 块 的 概念 ， 并 且 让 它 
们 块 间 有 序 了 。 人 至 于 上 层 中 《红楼 梦 》 是 应 该 放 在 《三 国 演义 》 的 左边 
还 是 右边 ， 并 不 是 很 重要 。 毕 竟 要 找 小 说 《三 国 演义 》， 只 需要 对 这 一 
层 的 图 书 用 眼睛 扫 过 一 人 过 就 能 很 容易 但 找到 。 

















我 们 再 来 分 析 一 下 分 块 索引 的 平均 查找 长 度 。 设 n 个 记录 的 数据 集 被 平 
均 分 成 m 块 ， 每 个 块 中 有 t 条 记录 ， 显 然 n=mxt， 或 者 说 m=m/t。 再 假设 Lp 
为 查找 索引 表 的 平均 查找 长 度 ， 因 最 好 与 最 差 的 等 概率 原则 ， 所 以 Li 的 
平均 长 度 为 (m+1)/2。L, 为 块 中 查找 记录 的 平均 查找 长 度 ， 同 理 可 知 它 
的 平均 查找 长 度 为 (t+1)/2。 














这 样 分 块 案 引 俘 找 的 平均 但 找 长 度 为 : 


ASL =L,+L sR a ee “+t lH 
/ 2 2 | 7 


注意 上 面 这 个 式 子 的 推导 是 为 了 让 整个 分 块 索 引 查找 长 度 依赖 0 和 t 两 个 
变量 。 从 这 里 了 我 们 也 融 得 到 ， 平 均 长 度 不 仅仅 取 雇 于 数据 集 的 总 记录 
数 "， 还 和 每 一 个 块 的 记录 个 数 t 相 关 。 最 佳 的 情况 就 是 分 的 块 数 m 与 块 
中 的 记录 数 t 相 同 ， 此 时 意味 着 n=mxt=tt， 即 

ASL, =1/2:(n/t+t)+1=t+1=sqrt(n)+1. 


可 见 ， 分 块 索引 的 效率 比 之 顺序 查找 的 O(o) 是 高 了 不 少 ， 不 过 显然 它 与 
折 半 查找 的 O(logn) 相 比 还 有 不 小 的 差距 。 因 此 在 确定 所 在 块 的 过 程 中 ， 
由 于 块 间 有 序 ， 所 以 可 以 应 用 折 半 、 插 值 等 手段 来 提高 效率 。 


总 的 来 说 ， 分 块 索引 在 兼顾 了 对 细 分 块 不 需要 有 序 的 情况 下 ， 大 大 增加 
了 整体 得 找 的 速度 ， 所 以 普通 和 被 用 于 数据 库 表 碍 找 等 技术 的 应 用 当中 。 





8.5.3 倒 排 索引 








我 不 知道 大 家 有 没有 对 搜索 引擎 好 奇 过 ， 无 论 你 伍 找 什么 样 的 信息 ， 它 
都 可 以 在 极 短 的 时 间 内 给 你 一 些 结果 ， 如 图 8-5-5 所 示 。 是 什么 算法 技术 
达到 这 样 的 高 效 奉 找 呢 ? 





#385 19,300,000 条 结果 (中 時 008P) 


图 8-5-5 





我 们 在 这 里 介绍 最 简单 的 ， 也 算是 最 基 索 技术 到 排 索 引 。 








我 们 来 看 样 例 ， 现 在 有 两 篇 极 短 的 英文 “文章 ”一 一 其 实 只 能 算是 句子 ， 
我 们 暂 认 为 它 是 文章 ， 编 写 分 别 是 1 和 2。 











1.Books and friends should be few but good.〔 读 书 如 交友 ， 应 求 少 而 
精 。 
2.A good book is a good friend. CF P WEA- 


假设 我 们 忽略 掉 如 “books”"、“friends” 中 的 复数 “s” 以 及 如 “A” 这 样 的 大 小 
写 差 寞 。 我 们 可 以 整理 出 这 样 一 张 单词 表 ， 如 表 8-5-1 所 示 ， 并 将 单词 做 
了 排序 ， 也 束 是 表格 显示 7 每 个 不 同 的 单词 分 ? 列 出 现在 哪 往 文章 中 ， 比 
如 “good” 它 在 两 篇 文章 中 都 有 出 现 ， 而 *is” 只 是 在 文章 2 中 才 有 。 











表 8-5-1 


英文 单词 文章 编号 
a 


few 1 
friend 1,2 
good 1,2 


is 2 
should 1 





有 了 这 样 一 张 单词 表 ， 我 们 要 搜索 文章 ， 就 非常 方便 了 。 如 果 你 在 搜索 
HEH IAS “book” KEF. AAMC TER KPA EK “book”, R 
到 后 将 它 对 应 的 文章 编写 1 和 2 的 文章 地 址 (通常 在 搜索 引擎 中 就 是 网 页 
的 标题 和 链接 ) 返回 ， 并 告诉 你 ， 碍 找到 两 条 记录 ， 用 时 0.0001 秒 。 由 
于 单词 表 是 有 序 的 ， 但 找 效率 很 品 ， 返 回 的 又 只 是 文章 的 编号， 所 以 整 
体 速 度 都 非常 快 。 























如 果 没 有 这 张 单词 表 ， 为 了 能 证 实 所 有 的 文章 中 有 还 是 没有 关键 
字 “book"， 则 需要 对 每 一 篇 文章 每 一 个 单词 顺序 查找 。 在 文章 数 是 海量 
的 情况 下， 这 样 的 做 法 只 存在 理论 上 可 行 性 ， 现 实 中 是 没有 人 原意 使 用 





























在 这 里 这 张 单词 表 就 是 索引 表 ， 索 引 项 的 通用 络 构 是 : 


。 次 关键 码 ， 例 如 上 面 的 “英文 单词 ”， 
* 记录 号 表 ， 例 如 上 面 的 “文章 编号 ”。 





其 中 记录 写 表 存储 具有 相同 次 关键 字 的 所 有 记录 的 记录 号 《可 以 是 指 问 
记录 的 指针 或 者 是 该 记录 的 主 关 键 字 ) 。 这 样 的 索引 方法 就 是 倒 排 索引 
(in-verted index) 。 倒 排 索 引 源 于 实际 应 用 中 需要 根据 属性 (或 字段 、 
(RRB) 的 值 来 查找 记录 。 这 种 索引 表 中 的 每 一 项 都 包括 一 个 属性 值 
和 上 有 具有 该 属性 值 的 各 记录 的 地 址 。 由 于 不 是 由 记录 来 确定 属性 值 ， 而 是 
由 属性 值 来 确定 记录 的 位 置 ， 因 而 称 为 倒 排 索引 。 




















倒 排 索 引 的 优点 显然 就 是 查找 记录 非常 快 ， 基 本 等 于 生成 索引 表 后 ， 碍 
找 时 都 不 用 去 读 取 记录 ， 束 可 以 得 到 结果 。 但 它 的 缺点 是 这 个 记录 号 不 
定 长 ， 比 如 上 例 有 7 个 单词 的 文章 编号 只 有 一 个 ， 

而 “book”、“friend”、“good” 有 两 个 文章 编号， 和 是 对 多 篇 文章 所 有 单词 








建立 倒 排 索引 ， 那 每 个 单词 都 将 对 应 相当 多 的 文章 编号 ， 维 护 比 较 困 
难 ， 插 入 和 删除 操作 都 需要 作 相 应 的 处 理 。 











当然 ， 现 实 中 的 搜索 技术 非常 复杂 ， 比 如 我 们 不 仅 要 知道 某 篇 文章 有 要 
搜索 的 关键 字 ， 还 想 知道 这 个 关键 字 在 文章 中 的 哪些 地 方 出 现 ， 这 就 需 
要 我 们 对 记录 号 表 做 一 些 改良 。 再 比如 ， 文 章 编号 上 亿 ， 如 果 都 用 长 数 
字 也 没 必 要 ， 可 以 进行 压缩 ， 比 如 三 篇 文章 的 编号 是 “112,115,119”， 我 
们 可 以 记录 成 “112,+3,+4”， 即 只 记录 差 值 ， 这 样 每 个 关键 字 就 只 占用 一 
两 个 字 节 。 甚 至 关键 字 也 可 以 压缩 ， 比 如 前 一 条 记录 的 关键 字 

是 “and”* 而 后 一 条 是 “an-droid”， 那 么 后 面 这 个 可 以 改 成 “<3,roid>”， 这 样 
也 可 以 起 到 压缩 数据 的 作用 。 再 比如 搜索 时 ， 尽 管 告诉 你 有 几 千 几 万 条 
查找 到 的 记录 ， 但 其 实 真正 显示 给 你 看 的 ， 就 只 是 当中 的 前 10 或 者 20 条 
左右 数据 ， 只 有 在 点 击 下 一 页 时 才 会 获得 后 面 的 部 分 索引 记录 ， 这 也 可 
以 大 大 提高 了 整体 搜索 的 效率 。 




















呵呵 ， 有 同学 说 得 没 错 ， 如 有 果 文 章 是 中 文 就 更 加 复杂 。 比 如 文章 中 出 

PUP RA, ERA CERES, WASHER. “国人 ”也 都 可 能 是 要 查找 
的 关键 字 一 一 啊 ， 太 复 林 了 ， 你 还 是 自己 去 找 相关 资料 吧 。 如 果 想 彻 扩 
明白 ， 努 力 进 入 google 或 者 百度 公司 做 搜索 引擎 的 软件 工程 师 ， 我 想 他 
们 会 满足 你 对 技术 知识 的 淘 求 。 











我 们 读 痊 上 就 是 起 到 抛砖引玉 的 作用 ， 和 硕 望 可 以 让 你 对 搜索 技术 产生 兴 
趣 ， 我 会 非常 欣慰 的 ， 休 乱 一 下 。 


8.6 ”二 又 排序 树 


大 家 可 能 部 听 过 这 个 故事 ， 说 有 两 个 年 轻 人 正在 深山 中 行走 。 忽 然 友 现 
远 处 有 一 只 老虎 要 冲 过 来 ， EAT? 其 中 一 个 赶忙 弯 腰 系 畦 带 ， 另 一 个 
奇怪 地 问 :“ 你 系 鞋 融和 干什么 ? 你 不 可 能 跑 得 比 老虎 还 快 。” 系 鞋 带 者 

说 “RAT AW Ee AE PEN? 我 只 要 跑 得 比 你 快 就 行 了 。” 


这 真是 交友 不 慎 呀 ! 别 急 ， 如 宁 你 的 朋友 是 系 鞋 市 者 ， 你 怎么 办 ? 


后 来 老虎 来 了 ， 系 鞋 带 者 拼命 地 跑 ， 另 一 人 则 急中生智 ， 疏 到 了 树 上 。 
老虎 在 选择 爬 树 还 是 奶 人 之 间 ， 当 然 是 会 选择 后 者 ， 于 是 HA sates Mey 
者 改变 了 跑 的 思想 ， 这 一 改变 何等 重要 ， 失 回 了 目 己 的 一 条 命 。 
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图 8-6-1 


好 了 ， 这 个 故事 也 告诉 我 们 ， 所 谓 优 势 只 不 过 是 比 别人 多 深入 思考 一 扣 
而 已 。 


假设 僵 找 的 数据 集 是 普通 的 顺序 存储 ， 那 么 插入 操作 就 是 将 记录 放 在 表 
的 末端 ， 给 表 记 录 数 加 一 即 可 ， 删 除 操作 可 以 是 删除 后 ， 后 面 的 记录 问 


前 移 , tay De ZR ca Sa PITRE, KERKASA 
正 整 个 数据 集 也 没有 什么 顺序 ， 这 样 的 效率 也 不 错 。 应 该 说 ， 插 入 和 删 
除 对 于 顺序 存储 结构 来 说 ， 效 率 是 可 以 接受 的 ， 但 这 样 的 表 由 于 无 序 造 
成 查找 的 效率 很 低 ， 前 面 我 们 有 讲解 ， 这 就 不 在 哆 嗓 。 





如 末 碍 找 的 数据 集 是 有 序 线性 硼 ， 并 且 是 顺序 存储 的 ， 碍 找 可 以 用 折 
半 、 插 值 、 斐 波 那 外 等 查找 算法 来 实现 ， 可 惜 ， 因 为 有 序 ， 在 插入 和 删 
除 操作 上 ， 束 需要 耗费 大 量 的 时 间 。 





有 没有 一 种 即 可 以 使 得 插入 和 删除 效率 不 错 ， 又 可 以 比较 高 效率 地 实现 
查找 的 算法 呢 ? 还 真有 。 





我 们 在 8.2 节 把 这 种 需要 在 查找 时 插入 或 删除 的 查找 表 称 为 动态 查找 
表 。 我 们 现在 就 来 看 看 什么 样 的 结构 可 以 实现 动态 查找 表 的 高 效率 。 





如 果 在 复杂 的 问题 面前 ， 我 们 束手无策 的 话 ， 不 妨 先 从 最 最 简单 的 情况 
入 手 。 现 在 我 们 的 目标 是 插入 和 查找 同样 高 效 。 假 设 我 们 的 数据 集 开始 
只 有 一 个 数 {62}， 然 后 现在 需要 将 88 插 入 数据 集 ， 于 是 数据 集成 了 
{62,88}， 还 保持 着 从 小 到 大 有 序 。 再 查找 有 没有 58， 没 有 则 插入 ， 可 
此 时 要 想 在 线性 表 的 顺序 存储 中 有 序 ， 就 得 移动 62 和 88 的 位 置 ， 如 图 8- 
6-2 左 图 ， 可 不 可 以 不 移动 呢 ? 咽 ， 当 然 是 可 以 ， 那 就 是 二 叉 树 结构 。 
当 我 们 用 三 又 树 的 方式 时 ， 首 先 我 们 将 第 一 个 数 62 定 为 根 结 点 ，88 因 为 
比 62 大 ， 因 此 让 它 做 62 的 右 子 树 ，58 因 比 62 小 ， 所 以 成 为 它 的 左 子 树 。 
此 时 58 的 插入 并 没有 影响 到 62 与 88 的 关系 ， 如 图 8-6-2 右 图 所 示 。 
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图 8-6-2 


也 就 是 说 ， 若 我 们 现在 需要 对 集合 {62,88,58,47,35,73,51,99,37,93} 做 查 
找 ， 在 我 们 打算 创建 此 集合 时 就 考虑 用 二 又 树 结 构 ， 而 且 是 排 好 序 的 二 
又 树 来 创建 。 如 图 8-6-3 所 示 ，62、88、58 创 建 好 后 ， 下 一 个 数 47 因 比 58 
小 ， 是 它 的 左 子 树 ( 见 @) ，35 是 47 的 左 子 树 〈 见 由 ) , 73 比 62 大 , 但 
却 比 88 小 ， 是 88 的 左 子 树 〈 见 @) ，51 比 62 小 、 比 58 小 、 比 47 大 ， 是 47 
的 右 子 村 CO) , 99 比 62、88 都 大 , 十 88 的 右 子 村 WOM) , 37 比 
62、58、47 都 小 , 但 却 比 35 大 , 是 35 的 右 子 村 (見 ⑧) ，93 则 因 比 62、 
B8K TINA LM (見 ⑨) 。 


图 8-6-3 





这 样 我 们 就 得 到 了 一 柠 二 又 树 ， 并 且 当 我 们 对 它 进 行 中 序 禹 历时 ， 吏 可 
以 得 色 一 條 有 序 的 序列 {35,37,47,51,58,62,73,88,93.99}, 所 以 我 作 通常 
称 它 为 二 又 排序 树 。 


二 又 排序 树 〈Binary Sort Tree) ， 又 称 为 二 又 碍 找 树 。 它 或 者 是 一 标 空 
树 ， 或 者 是 具有 下 列 性 质 的 二 又 树 。 
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。 它 的 左 、 右 子 树 也 分 别 为 二 又 排序 树 。 

从 二 又 排序 树 的 定义 也 可 以 知道 ， 它 前 提 是 二 又 树 ， 然 后 它 采 用 了 递归 


的 定义 方法 ， 再 者 ， 它 的 结 点 间 满 足 一 定 的 次 序 关 系 ， 左 子 树 结 点 一 定 
比 其 双亲 结 点 小 ， 右 子 树 结 点 一 定 比 其 双亲 结 点 大 。 





构造 一 标 二 叉 排 序 树 的 目的 ， 其 实 并 不 是 为 了 排序 ， 而 是 为 了 提高 查找 
和 插入 删除 关键 字 的 速度 。 不 管 怎么 说 ， 在 一 个 有 序数 据 集 上 的 碍 找 ， 
速度 总 是 要 快 于 无 序 的 数据 集 的 ， 而 二 又 排序 树 这 种 非 线性 的 结构 ， 也 
有 利于 插入 和 删除 的 实现 。 








8.6.1 — CHEAP PY EERE 


首先 我 们 提供 一 个 二 又 树 的 结构 。 


/* 二 义 树 的 二 叉 链 表 结 点 结构 定义 */ 
/* 结 点 结构 */ 
typedef struct BiTNode 


/* 结 点 数据 */ 

int data; 

[ee EERE ERA 

struct BiTNode *lchild, *rchild; 
} BiTNode, *BiTree; 


然后 我 们 来 看 看 二 又 排序 树 的 查找 是 如 何 实 现 的 。 
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归 查 找 二 又 排序 树 T 中 是 否 存在 key， a 
针 f 指 向 T 的 双亲 ， 其 初始 调 ee ay, 
查找 成 功 ， 则 指 针 p 指 向 该 数据 元 素 结 a gr 
可 TRUE */ 
则 指针 p 指 向 查找 路 径 上 访问 的 最 后 一 个 结 点 

并 返回 FALSE */ 
Status SearchBST(BiTree T, int key, BiTree f, BiTree *D) 
{ 
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Vas: 
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Pa 
return FALSE; 


} 
/* 查找 成 功 */ 
else if (key == T->data) 


SI 
return TRUE; 


else if (key < T->data) 
/* 在 左 子 树 继续 查找 */ 
return SearchBST(T->1chi1d, key, T, p); 











/* 在 右 子 树 继 续 查 找 */ 
return SearchBST(T->rchild, key, T, p); 





1. SearchBST 函 数 是 一 个 可 递归 运行 的 函数 ， 函 数 调用 时 的 语句 为 
SearchBST(T,93,NULL,p)， 参 数 T 是 一 个 二 又 链表 ， 其 中 数据 如 图 8-6-3 


所 示 ，key 人 代表 要 查找 的 关键 字 ， 目 前 我 们 打算 奋 找 93， 二 又 树 {f 指 癌 T 
的 双亲 ， 当 T 指 疝 根 结 点 时 ，f 的 初 值 束 为 NULL， 它 在 递归 时 有 用 ， 最 
后 的 参数 p 是 为 了 碍 找 成 功 后 可 以 得 到 奉 找 到 的 结 点 位 置 。 








2. 第 3 一 7 行 ， 是 用 来 判断 当前 二 又 树 是 否 到 叶子 结 点 ， 显 然 图 8-6-3 告 
诉 我 们 当前 工 指 同根 结 点 62 的 位 置 ，T 不 为 空 ， 第 5 一 6 行 不 执行 。 


3. 第 8 一 12 行 是 查找 到 相 匹 配 的 关键 字 时 执行 语句 ， 显 然 93 上 62， 第 10 
一 11 行 不 执行 。 


4. 第 13 一 14 行 是 当 要 查找 关键 字 小 于 当前 结 点 值 时 执行 语句 ， 由 于 
93>62， 第 14 行 不 执行 。 


5. 第 15~16 行 是 当 要 查找 关键 字 大 于 当前 结 点 值 时 执行 语句 ， 由 于 
93>62， 所 以 递归 调用 SearchBST(T->rchild,key,T,p)。 此 时 T 指 向 了 62 的 
右 孩 子 88， 如 图 8-6-4 所 示 。 


图 8-6-4 


6. 此 时 第 二 层 SearchBST， 因 93 比 88 大 ， 所 以 执行 第 16 行 ， 再 次 递归 调 
用 SearchBST(T->rchild,key,T,p)。 此 时 T 指 向 了 88 的 右 孩 子 99， 如 图 8-6-5 
所 示 。 


图 8-6-5 


7. 第 三 层 的 SearchBST， 因 93 比 99 小 ， 所 以 执行 第 14 行 ， 递 归 调 用 
SearchBST(T->lchild,key,T,p)。 此 时 T 指 向 了 99 的 左 孩 子 933， 如 图 8-6-6 所 
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图 8-6-6 


8. 第 四 层 SearchBST， 因 key 等 于 T->data， 所 以 执行 第 10 一 11 行 

行 ， 此 时 
指针 p 指 向 93 所 在 的 结 点 ， 并 返回 True 到 第 三 层 、 第 二 层 、 第 一 层 ， 最 
终 函 数 返 回 True。 





8.6.2 ”二 文 排序 树 插 入 操作 


有 了 二 又 排序 树 的 碍 找 函 数 ， 那 么 所谓 的 二 又 排序 树 的 插入 ， 其 实 也 束 
是 将 关键 字 放 到 树 中 的 合适 位 置 而 已 ， 来 看 代码 。 











/* 当 二 叉 排序 树 T 中 不 存在 关键 字 等 于 Key 的 数据 元 

素 时 ， fh 
/* 插入 key 并 返回 TRUE， 否 则 返回 FALSE */ 
Status InsertBST(BiTree *T, int key) 
a 









































BiTree p, S: 

/* BRAM */ 

if (!SearchBST(*T, key, NULL, &p)) 

6 
s = (BiTree)malloc(sizeof(BiTNode) ) / 
s->data = key; 
s->lchild = s->rchild = NULL; 


插入 s 为 新 的 根 结 点 */ 





S; 
else if (key < p->data) 
/* 播 入 S 为 左 孩子 */ 
p->lchild = s; 

















/* 插入 s 为 右 孩 子 */ 
p->rchild = s; 
return TRUE; 





else 
/* 树 中 己 有 关键 字 相 同 的 结 点 ， 不 再 插入 */ 
return FALSE; 

















这 段 代 码 非 常 简 单 。 如 果 你 调用 函数 是 “In-sertBST(&T,93);”， 那 么 结果 
就 是 FALSE， 如 果 是 “InsertBST(&T,95);”， 那 么 一 定 就 是 在 93 的 结 点 增 
加 一 个 右 孩 子 95， 并 且 返 回 True。 如 图 8-6-7 所 示 。 


图 8-6-7 








有 了 二 又 排序 树 的 插入 代码 ， 我 们 要 实现 二 又 排序 树 的 构建 就 非常 容易 
了 。 下 面 的 代码 就 可 以 创建 一 棵 图 8-6-3 这 样 的 树 。 


MERILE 

AE eE nn eS TCG 
99737 eke aye 

BiTree T = NULL; 

RENE (lites OF Spee E O r] 


InsertBST(&T, a[i]); 


在 休 的 大 脳 里 , BCAA I EAS MANE E SITE E RM 
OSI 那 只 能 说 明 你 还 没 真理 解 它 的 原理 


8.6.3 ”二 又 排序 树 删除 操作 


俗话 说 “请 神 容易 送 神 难 ?， 我 们 已 经 介绍 了 二 又 排序 树 的 碍 找 与 插入 算 
法 ， 但 是 对 于 二 又 排序 树 的 删除 ， 瓯 不 是 那么 容易 ， 我 们 不 能 因为 删除 
I 
种 情况 。 





如 果 需 要 查找 并 删除 如 37、51、73、93 这 些 在 二 又 排序 树 中 是 叶子 的 结 
点 ， 那 是 很 容易 的 ， 毕 竟 删 除 它 们 对 整 棵 树 来 说 ， 其 他 结 点 的 结构 并 未 
受到 影响 ， 如 图 8-6-8 所 示 。 








图 8-6-8 


对 于 要 删除 的 结 点 只 有 左 子 树 或 只 有 右 子 树 的 情况 ， 相 对 也 比较 好 解 

决 。 那 就 是 结 点 删除 后 ， 将 它 的 左 子 树 或 右 子 树 整个 移动 到 删除 结 点 的 
位 置 即 可 ， 可 以 理解 为 独子 继承 父 业 。 比 如 图 8-6-9， 就 是 先 删除 35 和 99 
结 点 ， 再 删除 58 结 点 的 变化 图 ， 最 终 ， 整 个 结构 还 是 一 个 二 又 排序 树 。 





删除 3$、99 了 两 结 点 删除 58 结 点 








图 8-6-9 


但 是 对 于 要 删除 的 结 点 既 有 左 子 树 又 有 右 子 树 的 情况 怎么 办 呢 ? 比如 图 
8-6-10 中 的 47 结 点 若 要 删除 了 ， 它 的 两 儿子 以 及 子孙 们 怎么 办 呢 ? 





图 8-6-10 


起 初 的 想法 ， 我 们 当 47 结 点 只 有 一 个 左 子 树 ， 那 么 做 法 和 一 个 左 子 树 的 
操作 一 样 ， 让 35 及 它 之 下 的 结 点 成 为 58 的 左 子 树 ， 然 后 再 对 47 的 右 子 树 





所 有 结 点 进行 插入 操作 ， 如 图 8-6-11 所 示 。 这 是 比较 简单 的 想法 ， 可 是 
47 的 右 子 树 有 子孙 共 5 个 结 点 ， 这 么 做 效率 不 高 且 不 说 ， 还 会 导致 整个 
二 又 排序 树 结构 发 生 很 大 的 变化 ， 有 可 能 会 增加 树 的 高 度 。 增 加 高 度 可 
不 是 个 好 事 ， 这 我 们 待 会 再 说 ， 总 之 这 个 想法 不 太 好 。 





MIRAT, ZEB 
58 与 35 结 点 \ 


图 8-6-11 





BAF ASE — F AZAD TS PP BE AER h AS 2 wk A DI AIE ? 
RAA, 37 或 者 48 都 可以 代替 47, UCN CEM BR E, 整 介 二 叉 排 序 樹 井 
没有 发 生 什么 本 质 的 改变 。 








为 什么 是 37 和 48? 对 的 ， 它 们 正好 是 二 又 排序 树 中 比 它 小 或 比 它 大 的 最 
接近 47 的 两 个 数 。 也 就 是 说 ， 如 果 我 们 对 这 棵 二 又 排序 树 进行 中 序 通 
历 ， 得 到 的 序列 {29,35,36,37,47,48,49,50,51,56,58,62,73,88,93,99}， 它 们 
正好 是 47 的 前 驱 和 后 继 。 





因此 ， 比 较 好 的 办 法 束 是 ， 找 到 需要 删除 的 结 反 p 的 卫 接 前 驱 (或 直接 
后 继 ) s， 用 s 来 珍 换 结 点 p， 人 然后 再 删除 此 结 点 s， 如 图 8-6-12 所 示 。 





删除 47 结 点 1) EN RITAR 
2) 删除 37 结 点 ; 
3) 将 36 移 至 原 37 的 位 置 





1) 4 被 直接 后 继 48 营 换 ; 
2) 删除 48 结 点 ; 


图 8-6-12 


根据 我 们 对 删除 结 点 三 种 情况 的 分 析 : 


に 叶子 结 点 ; 

。 仪 有 左 或 右 子 树 的 结 点 ; 

e 左右 子 树 都 有 的 结 点 ， 我 们 来 看 代 人 三， 下面 这 个 算法 是 递归 方式 对 
二 又 排序 树 T 查 找 key， 碍 找到 时 删除 。 




















/* 知 二 又 排序 树 T 中 存在 关键 字 等 于 key 的 数据 元 素 
时 ， 则 删除 该 数据 元 素 结 点 ，*/ 

/* 并 返回 TRUE; 否则 返回 FALSE */ 

Status DeleteBST(BiTree *T, int key) 

{ 


























/* 不 存在 关键 字 等 于 key 的 数据 元 素 */ 
f(T) 

return FALSE; 
else 








/* 找到 关键 字 等 于 key 的 数据 元 素 */ 
if (key == (*T)->data) 
return Delete(T); 
else if (key < (*T)->data) 
return DeleteBST(&(*T)->lchild, key); 


else 
return DeleteBST(&(*T)->rchild, key); 


这 段 代 码 和 前 面 的 二 又 排序 树 查 找 几 乎 完全 相同 ， 唯 一 的 区 别 就 在 于 第 
8 行 ， 此 时 执行 的 是 Delete 方 法 ， 对 当前 结 点 进行 删除 操作 。 我 们 来 看 
Delete 的 代码 。 





/* 从 二 又 排序 树 中 删除 结 点 p， 并 重 接 它 的 左 或 右 子 树 。 */ 
Status Delete(BiTree *p) 


BiTree q, S; 
/* 右 子 树 空 则 只 需 重 接 它 的 左 子 树 */ 
if ((*p)->rchild == NULL) 











26 ->lchild; 














Ta 只 需 重 接 它 的 右 子 树 A 
else if ((*p)->lchild == NULL) 
{ 





& = 
*p = で De ->rchild; 
free(q); 


} 
EER RE 


else 


{ 
Gk=ss presen (Ep) eenn 
Ue whe, 然后 向 右 到 尽头 ( 找 待 删 结 点 的 前 驱 ) */ 
while (s->rchild) 
{ 


q = s; s = s->rchild; 


} 
/* S 指 向 被 删 结 点 的 直接 前 驱 */ 
(*p)->data = s->data; 
if (q != *p) 
/* 重 接 q 的 右 子 树 */ 
q->rchild = s->lchild; 








else 








/* 重 接 q 的 左 子 樹 */ 
q->lchild = s->lchild; 
free(S): 


return TRUE; 





1. 程序 开始 执行 ， 代 码 第 4 一 7 行 目 的 是 为 了 删除 没有 右 子 树 只 有 左 子 
树 的 结 点 。 此 时 只 需 将 此 结 点 的 左 孩子 丛 换 它 自 己 ， 然 后 释放 此 结 扣 内 
存 ， 就 等 于 删除 了 。 


2. 代码 第 8 一 11 行 是 同样 的 道理 处 理 只 有 右 子 树 没 有 左 子 树 的 结 点 删除 


问题 。 
3. 第 12 一 25 行 处 理 复 杂 的 左右 子 树 均 存在 的 问题 。 


4. 第 14 行 ， 将 要 删除 的 结 点 p 赋 值 给 临时 的 变量 q， 再 将 p 的 左 孩 子 p- 
>lchild 威 值 给 临时 的 变量 Ss。 此 时 q 指 同 47 结 点 ，s 指 癌 35 结 点 ， 如 图 8-6- 
13 所 示 。 


图 8-6-13 


5. 第 15 一 18 行 ， 循 环 找到 左 子 树 的 右 结 点 ， 直 到 右 侧 尽头 。 惑 当前 例 
e TR E 
6-14 所 示 。 


f/m e 
@) G7) W) (⑮ 
35) G) GO 


图 8-6-14 


6. 第 19 行 ， 此 时 让 要 删除 的 结 点 p 的 位 置 的 数据 被 赋值 为 s->data， 即 让 
p->data=37， 如 图 8-6-15 所 示 。 


に 


OE 
ORORO 


图 8-6-15 


7. 第 20 一 23 行 ， 如 果 p 和 qd 指向 不 同 ， 则 将 s->lchild 赋 值 给 q->rchild， 人 否 
则 就 是 将 s->lchild 赋 值 给 q->lchild。 显 然 这 个 例子 p 不 等 于 q， 将 S->lchild 


指向 的 36 赋 值 给 q->rchild， 也 就 是 让 q->rchild 指 向 36 结 点 ， 如 图 8-6-16 所 
ZN o 


DEAE 
OG 


图 8-6-16 


8. 第 24 行 , free(s), 就 非常 好 理 解 了 , 3725 INR, 如 関 8-6-17 所 
ZN 。 


图 8-6-17 


从 这 段 代 码 也 可 以 看 出 ， 我 们 其 实 是 在 找 删除 结 点 的 前 驱 结 点 葵 换 的 方 
法 ， 对 于 用 后 继 结 反 来 蔡 换 ， 方 法 上 是 一 样 的 。 


8.6.4 二 又 排序 树 总 结 


总 之 ， 二 叉 排 序 树 是 以 链接 的 方式 存储 ， 你 持 了 链接 存储 结构 在 执行 插 
入 或 删除 操作 时 不 用 移动 元 素 的 优点 ， 只 要 找到 合适 的 插入 和 删除 位 置 
后 ， 仅 需 修 改 链接 指针 即 可 。 播 入 删除 的 时 间 性 能 比较 好 。 而 对 于 二 又 
排序 树 的 碍 找 ， 走 的 就 是 从 根 结 点 到 要 查找 的 结 点 的 路 径 ， 其 比较 次 数 
等 于 给 定 值 的 结 点 在 二 又 排序 树 的 层 数 。 极 端 情况 ， 最 少 为 1 次 ， 即 根 
结 点 束 是 要 找 的 结 点 ， 最 多 也 不 会 超过 树 的 深度 。 也 惑 是 说 ， 二 又 排序 
树 的 查找 性 能 取决 于 二 又 排序 树 的 形状 。 可 问题 就 在 于 ， 二 又 排序 树 的 
形状 是 不 确定 的 。 

















例如 {62,88,58,47,35,73,51,99,37,93} 这 样 的 数组 ， 我 们 可 以 构建 如 图 8-6- 
18 左 图 的 二 又 排序 树 。 但 如 果 数 组 元 素 的 次 序 是 从 小 到 大 有 序 ， 如 
{35,37,47,51,58,62,73,88,93,99}， 则 二 又 排 序 树 就 成 了 极端 的 右 斜 树 ， 
注意 它 依然 是 一 棵 二 又 排序 树 ， 如 图 8-6-18 的 右 图 。 此 时 ， 同 样 是 查找 
结 点 99， 左 图 只 需要 两 次 比较 ， 而 右 图 就 需要 10 次 比较 才 可 以 得 到 结 
果 ， 二 者 差异 很 大 。 




















图 8-6-18 








也 就 是 说 ， 我 们 希望 二 又 排序 树 是 比较 平衡 的 ， 即 其 深度 与 完全 二 又 树 
相同 ， 均 为 ， 那 么 查找 的 时 间 复 杂 也 就 为 OQogn)， 近 似 于 折 半 查找 ， 事 
实 上 ， 图 8-6-18 的 左 图 也 不 够 平衡 ， 明 显 的 左 重 右 轻 。 


不 平衡 的 最 坏 情 况 就 是 像 图 8-6-18 右 图 的 斜 树 ， 查 找 时 间 复 杂 度 为 
OO)， 这 等 同 于 顺序 得 找 。 








因此 ， 如 果 我 们 希望 对 一 个 集合 按 二 又 排 序 树 查 找 ， 最 好 是 把 它 构建 成 
一 柠 平 衡 的 二 又 排序 树 。 这 样 我 们 束 引 申 出 另 一 个 问题 ， 如 何 让 二 又 排 
序 树 平 衡 的 问题 。 


8.7 平衡 二 叉 樹 (AVL 樹 ) 


我 在 网 络 上 ， 看 到 过 一 部 德国 人 制作 的 叫 《 平 衡 》 (英文 名 : 

Balance) 的 短片 ， 它 在 1989 年 获得 奥斯卡 最 佳 短 片 奖 。 说 的 是 在 空 

中 , 基 浮 着 一 介 四 方 的 平板 , 上 面 敵 立 着 5 介 人 , TAPER FESR, 同 梓 的 
装束 ， 同 样 的 面 无 表情 。 平 板 的 中 心 是 个 看 不 见 的 支点 ， 为 了 平衡 ，5 
个 人 必须 寻找 合适 的 位 置 。 原 本 ， 简 单 的 站 在 中 心 束 可 以 了 ， 可 是 ， 如 
同 我 们 一 样 ， 他 们 也 好 奇 于 这 个 世界 ， 想 知道 下 面 是 什么 样子 。 而 随 着 
-个 箱子 的 来 临 ， 这 种 平衡 被 打破 了 ， 箱 子 市 来 了 首 乐 ， 带 来 了 兴 

也 帯 来 了 不 平衡 , THOR J Op BASES 











平板 就 赴 一 人 世界 , SRS Elm, 当 人 心中 的 平衡 被 打破 , 世界 就 会 混 
乱 ， 最 后 留 下 的 只 有 孤独 彼 寞 失败 。 这 种 单调 的 机 械 化 社会 ， 禁 不 住 诱 
惑 的 侵蚀 ， 很 容易 衣 误 。 最 容易 被 侵蚀 的 ， 恰 恰 是 最 空虚 的 心灵 。 








8-7-1 《 平 衡 》 


FRAP RAB) RL AR AZ, TERA AR SE EE BOI TAA LR, 有 ※ 趣 
的 同学 可 以 上 自己 搜索 观看 。 这 里 我 们 主要 是 讲 与 平衡 这 个 词 相关 的 数据 
结构 一 一 平衡 二 又 树 。 





平衡 二 叉 樹 (Self-Balancing Binary SearchTree 或 Height-Balanced Binary 
Search Tree) ， 是 一 种 二 又 排序 树 ， 其 中 每 一 个 节 所 的 堪 子 树 和 右 子 树 
的 高 度 差 至 多 等 于 1。 











有 两 位 俄罗斯 数学 家 G.M. Adelson-Velskii 和 E.M. Landis 在 1962 年 共同 发 
明 一 种 解决 平衡 二 叉 树 的 算法 ， 所 以 有 不 少 资料 中 也 称 这 样 的 平衡 二 又 
树 为 AVL 树 。 


从 平衡 二 叉 树 的 英文 名 字 ， 你 也 可 以 体会 到 ， 它 是 一 种 高 度 平衡 的 二 文 
排序 树 。 那 什么 叫做 高 度 平衡 呢 ? 意思 是 说 ， 要 么 它 是 一 棵 空 树 ， 要 么 
它 的 左 子 树 和 右 子 树 都 是 平衡 二 叉 树 ， 且 左 子 树 和 右 子 树 的 深度 之 产 的 
绝对 值 不 超过 1。 我 们 将 二 叉 树 上 结 点 的 左 子 树 深度 减 去 右 子 树 深度 的 

值 称 为 平衡 因子 BF (Balance Factor) ， 那 么 平衡 二 义 树 上 所 有 结 点 的 
平衡 因子 只 可 能 是 -1、0 和 1。 只 要 二 义 树 上 有 一 个 结 点 的 平衡 因子 的 绝 
对 值 大 于 1， 则 该 二 叉 树 就 是 不 平衡 的 。 




















看 图 8-7-2， 为 什么 图 1 是 平衡 二 又 树 ， 而 图 2 却 不 是 呢 ?” 这 里 就 是 考查 我 
们 对 平衡 二 叉 树 的 定义 的 理解 ， 它 的 前 提 首 先是 一 棵 二 又 排序 树 ， 右 上 
图 的 59 比 58 大 ， 却 是 58 的 左 子 树 ， 这 是 不 符合 二 又 排序 树 的 定义 的 。 图 
3 不 是 平衡 二 又 树 的 原因 就 在 于 ， 结 点 58 的 左 子 树 高 度 为 3， 而 右 子 树 为 
空 ， 二 者 差 大 于 了 绝对 值 1， 因 此 它 也 不 是 平衡 的 。 而 经 过 适当 的 调整 
后 的 图 4， 它 就 符合 了 定义 ， 因 此 它 是 平衡 二 又 树 。 














图 3 不 是 平 衡 二 叉 机 Rd Pe 


图 8-7-2 


距离 插入 结 反 最 近 的 ， 且 平衡 因子 的 绝对 值 大 于 1 的 结 扣 为 根 的 子 树 ， 








我 们 称 为 最 小 不 平衡 子 树 。 图 8-7-3， 当 新 插入 结 点 37 时 ， 距 离 它 最 近 的 
平衡 因子 绝对 值 超过 1 的 结 点 是 58〈 即 它 的 左 子 树 高 度 3 减 去 右 子 树 高 度 
) ， 所 以 从 58 开 始 以 下 的 子 树 为 最 小 不 平衡 子 树 。 











最 小 不 平衡 了 本 





MAERT : / 


图 8-7-3 


8.7.1 平衡 二 又 树 实现 原理 





平衡 二 又 树 构建 的 基本 思想 就 是 在 构建 二 又 排序 树 的 过 程 中 ， 每 当 插入 
一 个 结 点 时 ， 先 检查 是 否 因 插入 而 破坏 了 树 的 平衡 性 ， 若 是 ， 则 找 出 最 
小 不 平衡 子 树 。 在 保持 二 又 排序 树 特性 的 前 提 下 ， 调 整 最 小 不 平衡 子 树 
中 各 结 点 之 间 的 链接 关系 ， 进 行 相应 的 旋转 ， 使 之 成 为 新 的 平衡 子 树 。 











为 了 能 在 讲解 算法 时 轻松 一 些 ， 我 们 先 讲 一 个 平衡 二 又 树 构 建 过 程 的 例 
子 。 假设 我 们 现在 有 一 个 数组 a[10]={3,2,14,5,6,7,10,9,8} 需 要 构建 二 又 
排序 树 。 在 没有 学 习 平衡 二 又 树 之 前 ， 根 据 二 又 排序 树 的 特性 ， 我 们 通 
常会 将 它 构 建成 如 图 8-7-4 的 图 1 所 示 的 样子 。 虽 然 它 完 全 符合 二 又 排序 
树 的 定义 ， 但 是 对 这 样 高 度 达 到 8 的 二 又 树 来 说 ， 碍 找 是 非常 不 利 的 。 

我 们 更 期 望 能 构建 成 如 图 8-7-4 的 图 2 的 样子 ， 高 度 为 4 的 二 又 排序 树 才 可 
那么 现在 我 们 就 来 研究 如 何 将 一 个 数组 构建 出 
2 的 樹 2 

















A) 





图 8-7-4 


对 于 数组 a[10]={3,2,1,4,5,6,7,10,9,8} 的 前 两 位 3 和 2， 我 们 很 正常 地 构 
建 ， 到 了 第 3 个 数 “1? 时 ， 发 现 此 时 根 结 点 “3 的 平衡 因子 变 成 了 2， 此 时 
整 棵 树 都 成 了 最 小 不 平衡 子 树 ， 因 此 需要 调整 ， 如 图 8-7-5 的 图 1〈 结 点 
左上 角 数 字 为 平衡 因子 BEF 值 ) 。 因 为 BF 值 为 正 ， 因 此 我 们 将 整个 树 进 
行 右 旋 〈 顺 时 针 旋 转 ) ， 此 时 结 点 2 成 了 根 结 点 ，3 成 了 2 的 右 孩 子 ， 这 
样 三 个 结 点 的 BF 值 均 为 0， 非 常 的 平衡 ， 如 图 8-7-5 的 图 2 所 示 。 








图 8-7-5 


然后 我 们 再 增加 结 点 4， 平 衡 因 子 没有 超出 限定 范围 (-1, 0, 1) ， 如 
图 3。 增 加 结 点 5 时 ， 结 点 3 的 BF 值 为 -22， 说 明 要 旋转 了 。 由 于 BF 是 负 
值 ， 所 以 我 们 对 这 棵 最 小 平衡 子 树 进行 左旋 〈 逆 时 针 旋 转 ) ， 如 图 4， 
此 时 我 们 整个 树 又 达到 了 平衡 。 





继续 ， 增 加 结 点 6 时 ， 发 现 根 结 点 2 的 BF 值 变 成 了 -2， 如 图 8-7-6 的 图 6。 
所 以 我 们 对 根 结 点 进行 了 左旋 ， 注 意 此 时 本 来 结 点 3 是 4 的 左 孩子 ， 由 于 
旋转 后 需要 满足 二 又 排序 树 特性 ， 因 此 它 成 了 结 点 2 的 右 孩 子 ， 如 图 7。 
增加 结 点 7， 同 样 的 左旋 转 ， 使 得 整 棵 树 达 到 平衡 ， 如 图 8 和 图 9 所 示 。 














图 8-7-6 


当 增 加 结 点 10 时 ， 结 构 无 变化 ， 如 图 8-7-7 的 图 10。 再 增加 结 点 9， 此 时 
结 点 7 的 BF 变 成 了 -2， 理 论 上 我 们 只 需要 旋转 最 小 不 平衡 子 树 7、9、10 
即 可 ， 但 是 如 果 左 旋转 后 ， 结 点 9 就 成 了 10 的 右 孩 子 ， 这 是 不 符合 二 
排序 树 的 特性 的 ， 此 时 不 能 简单 的 左旋 ， 如 图 11 所 示 。 











+ 
7 いい 


0 比 10 小 ,不 可 以 是 gf | 10 | Nf 
HETA” AMA ON 


tan pat 





x 
AEN 
Niclas e T 
Le ata eae OER) 


10 





图 12 


图 8-7-7 








仔细 观察 图 11， 发 现 根本 原因 在 于 结 点 7 的 BF 是 -2， 而 结 点 10 的 BE 是 
1， 也 就 是 说 ， 它 们 俩 一 正 一 负 ， 符 号 并 不 统一 ， 而 前 面 的 几 次 旋转 ， 
无 论 左 还 是 右 旋 ， 最 小 不 平衡 子 树 的 根 结 点 与 它 的 子 结 点 符号 都 是 相同 
的 。 这 就 是 不 能 直接 旋转 的 关键 。 那 怎么 办 呢 ? 








不 统一 ， 不 统一 就 把 它们 先 转 到 符号 统一 再 说 ， 于 是 我 们 先 对 结 点 9 和 
结 点 10 进 行 右 旋 ， 使 得 结 点 10 成 了 9 的 右 子 树 ， 结 点 9 的 BF 为 -1， 此 时 就 
与 结 点 7 的 BF 值 符号 统一 了 ， 如 图 8-7-7 的 图 12 所 示 。 








这 样 我 们 再 以 结 点 7 为 最 小 不 平衡 子 树 进行 左旋 ， 得 到 图 8-7-8 的 图 13。 

接着 插入 8， 傅 况 与 刚才 类 似 ， 结 点 6 的 BF 是 -2， 而 它 的 右 护 子 9 的 BF 是 
1， 如 图 14， 因 此 首先 以 9 为 根 结 点 ， 进 行 右 旋 ， 得 到 图 15， 此 时 结 点 6 
和 结 点 7 的 符号 都 是 负 ， 再 以 6 为 根 结 点 左旋 ， 最 终 得 到 最 后 的 平衡 二 叉 
树 ， 如 图 8-7-8 的 图 16 所 示 。 














图 8-7-8 


AAA ARE: “丢失 一 个 钉子 ， 坏 了 一 只 蹄 铁 )， 坏 了 一 
只 蹄 铁 ， 折 了 一 匹 战 马 ， 折 了 一 匹 战 马 ， 伤 了 一 位 骑士 ; 伤 了 一 位 骑 
士 ， 输 了 一 场 战 斗 ， 输 了 一 场 战斗 ， 亡 了 一 个 第 国 。” 相 信 大 家 应 该 有 
点 明日 ， 所 谓 的 平衡 二 又 树 ， 其 实 就 是 在 二 又 排序 树 创 建 过 程 中 保证 它 
的 平衡 性 ， 一 旦 发 现 有 不 平衡 的 情况 ， 马 上 处 理 ， 这 样 吏 不 会 造成 不 可 
收拾 的 情况 出 现 。 通 过 刚才 这 个 例子 ， 你 会 及 现 ， 当 最 小 不 平衡 子 树 根 
结 点 的 平衡 因子 BF 是 大 于 1 时 ， 就 右 旋 ， 小 于 -1 时 束 左 旋 ， 如 上 例 中 结 
点 1、5、6、7 的 插入 等 。 插 入 结 点 后 ， 最 小 不 平衡 子 树 的 BF 与 它 的 子 
树 的 BF 符号 相反 时 ， 就 需要 对 结 反 先进 行 一 次 旋转 以 使 得 符 写 相同 
UI 
时 。 























8.7.2 平衡 二 又 树 实 现 算法 





好 了 ， 有 这 么 多 的 准备 工作 ， 我 们 可 以 来 讲解 代码 了 。 玫 先是 需要 改进 
二 又 排序 树 的 结 氮 结构 ， 增 加 一 个 bf， 用 来 存储 平衡 因子 。 





/* 二 叉 树 的 二 又 链表 结 点 结构 定义 */ 
/* 结 点 结构 */ 
typedef struct BiTNode 


/* 结 点 数据 */ 

int data; 

/* 结 点 的 平衡 因子 */ 

ole Dif 

/* 左右 玲子 指針 */ 

struct BiTNode *lchild, *rchild; 
} BiTNode, *BiTree; 

















然后 ， 对 于 右 旋 操 作 ， 我 们 的 代码 如 下 。 


/* 对 以 p 为 根 的 二 又 排 序 树 作 右 旋 处 理 ， */ 

/* 处 理 之 后 p 指 向 新 的 树 根 结 点 ， 即 旋转 处 理 之 前 
的 左 子 树 的 根 结 点 */ 

void R_Rotate(BiTree *P) 

{ 








BiTree L; 

/* L 指 向 P 的 左 子 树 根 结 点 */ 

L = (*P)->lchild; 

/* 上 的 右 子 树 挂 接 为 P 的 左 子 树 */ 
(*P) ->1chi1d = L->rchild; 
L->rchild = (*P); 

/* P 指 向 新 的 根 结 点 */ 

ee E; 








Tees SUIS eth, SAP SHEP PR, RPE EK PS 
定义 为 L， 将 LL 的 右 子 树 变 成 P 的 左 子 树 ， 再 将 P 改 成 L 的 右 子 树 ， 最 后 将 
L 蔡 换 P 成 为 根 结 点 。 这 样 就 完成 了 一 次 右 旋 操作 ， 如 图 8-7-9 所 示 。 图 
中 三 角形 代表 子 树 ，N 代 表 新 增 结 反 。 
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图 8-7-9 


和 





上 面 例子 中 的 新 增加 结 点 N( 如 图 8-7-5 的 图 1 和 图 2) ， 就 是 右 旋 操 作 。 


左旋 操作 代码 如 下 。 


/* 对 以 P 为 根 的 三 叉 排 序 树 作 左旋 处 理 ， 





a 


/* 处 理 之 后 P 指 向 新 的 树 根 结 点 ， 即 旋转 处 理 之 前 





的 右 子 树 的 根 结 点 9 */ 
void L_Rotate(BiTree *P) 


{ 





BiTree R; 
Ves er e 
R = (*P)->rchild; 


f R 的 左 子 树 挂 接 为 P 的 右 子 树 3y 





(*P)->rchild = R->lchild; 

R->lchild = (*P); 

(pe P 指 向 新 的 根 结 点 z 
SPIZIR; 


这 段 代 码 与 右 旋 代 人 码 是 对 称 的 ， 在 此 不 做 解释 了 。 上 面 例子 中 的 新 增 结 
点 5、6、7 (如 图 8-7-5 的 图 4、5， 图 8-7-6 的 图 6、7、8、9) ， 都 是 左旋 
操作 。 


现在 我 们 来 看 左 平衡 旋转 处 理 的 函数 代码 。 


#define LH +1 /* AR */ 

#define EH © /* 等 高 */ 

#define RH -1 /* 右 高 */ 

/* 对 以 指针 T 所 指 结 点 为 根 的 二 叉 树 作 左 平衡 旋转 
AbHH */ 

/* 本 算法 结束 时 ， 指 针 T 指 向 新 的 根 结 点 */ 

void LeftBalance(BiTree *T) 





























































































































{ 
BiTree L,Lr; 
/* 上 指向 T 的 左 子 树 根 结 点 */ 
L = (*T) ->1chi1d: 
switch (L->bf) 
{ 
/* 检查 T 的 左 子 树 的 平衡 度 ， 并 作 相 应 平衡 处 理 */ 
/* 新 结 点 插入 在 T 的 左 孩子 的 左 子 树 上 ， 要 作 单 右 旋 处 理 */ 
case LH: 
(*T)->bf = L->bf = EH; 
R_Rotate(T); 
break; 
/* 新 结 点 插入 在 T 的 左 孩子 的 右 子 树 上 ， 要 作 双 旋 处 理 */ 
case RH: 
/* Lr 指向 T 的 左 孩 子 的 右 子 树 根 */ 
Er = E-ernchald: 
/* 修改 T 及 其 左 孩子 的 平衡 因子 */ 
switch (Lr->bf) 
a 
case LH: (*T)->bf = RH; 
L->bf = EH; 
break; 
case EH: (*T)->bf = L->bf = EH; 
break; 
case RH: (*T)->bf = EH; 
L->bf = LH; 
break; 
} 
Lr->bf = EH; 
/* 对 T 的 左 子 树 作 左 旋 平衡 处 理 */ 
L_Rotate(&(*T)->lchild); 
/* 对 T 作 右 旋 平衡 处 理 */ 
R_Rotate(T); 
i: 
} 


首先 ， 我 们 定义 了 三 个 常数 变量 ， 分 别 代表 1、0、-1。 





1. 函 数 被 调用 ， 传 入 一 个 需 调 整 平衡 性 的 子 树 T。 由 于 LeftBalance 函 数 

被 调用 时 ， 其 实 是 已 经 确认 当前 子 树 是 不 平衡 状态 ， 且 左 子 树 的 高 度 大 

换 句 话说 ， 此 时 T 的 根 结 点 应 该 是 平衡 因子 BF 的 值 大 
1 的 数 。 

2. 第 4 行 ， 我 们 将 IT 的 左 孩 子 赋值 给 L。 

3. 第 5 一 27 行 是 分 文 判 断 。 

4. 当 工 的 平衡 因子 为 LH， 即 为 1 时 ， 表 明和 它 与 根 结 点 的 BE 值 符号 相同 ， 

因此 ， 第 8 行 ， 将 它们 的 BEF 值 都 改 为 0， 并 且 第 9 行 ， 进 行 右 旋 操 作 。 操 

作 的 方式 如 图 8-7-9 所 示 。 

5. 当 工 的 平衡 因子 为 RH， 即 为 -1 时 ， 表 明 它 与 根 结 点 的 BF 值 符 号 相反 ， 

此 时 需要 做 双 旋 处 理 。 第 13 一 22 行 ， 针 对 工 的 右 孩子 Li 的 BF 作 判 新 ， 修 

改 根 结 点 T 和 LL 的 BF 值 。 第 24 行 将 当前 L 的 BF 改 为 0。 

6. 第 25 行 ， 对 根 结 点 的 左 子 树 进行 左旋 ， 如 图 8-7-10 第 二 图 所 示 。 

7. 第 26 行 ， 对 根 结 点 进行 右 旋 ， 如 图 8-7-10 的 第 三 图 所 示 ， 完 成 平衡 操 








搬入 La 后 平衡 性 被 打破 ， 
插入 Ls 前 是 平衡 二 义 树 ” ” 先 左旋 以 保证 根 结 点 和 它 
的 左 孩 了 BF 符号 相同 





冉 右 旋 调 整 其 平衡 忻 ia a RET 


图 8-7-10 


同样 的 ， 右 平衡 旋转 处 理 的 函数 代码 非常 类 似 ， 直 接 看 代码 ， 不 做 讲解 
ce 


我 们 前 面 例子 中 的 新 增 结 点 9 和 8 就 是 典型 的 右 平 衡 旋 转 ， 并 且 双 旋 完 成 
平衡 的 例子 〈 如 图 8-7-7 的 图 11、12， 图 8-7-8 的 图 14、15、16 所 示 ) 。 


有 了 这 些 准备 ， 我 们 的 主 函 数 才 算是 正式 登场 了 。 





/* 若 在 平衡 的 二 又 排序 树 T 中 不 存在 和 e 有 相同 关键 
字 的 结 点 ， 则 插入 一 个 */ 
/* 数据 元 素 为 e 的 新 结 点 并 返回 I， 否则 返回 9。 若 
姑 插 入 而 使 二 又 排 序 树 */ 
/* 失去 平衡 ， 则 作 平 衡 旋转 处 理 ， 布 尔 变量 taller 
反映 T 长 高 与 否 。 */ 
Status InsertAVL(BiTree *T, int e, Status *taller) 
{ 






























































ply) 
{ 





/* 搬入 新 结 点 ， 树 “长 高 “， 置 talLer 为 TRUE */ 
*T = (BiTree)malloc(sizeof(BiTNode) ) ; 
(*T)->data = e; 

( *T) ->1chi1d = (*T)->rchild = NULL; 
(*T)->bf = EH; 

*taller = TRUE; 























} 


else 


if (e == (*T)->data) 























/* 树 中 已 存在 和 e 有 相同 关键 字 的 结 点 则 不 再 插入 */ 
*taller = FALSE; 
return FALSE; 


























} 
if (e < (*T)->data) 
{ 

















/* 应 继续 在 T 的 左 子 树 中 进行 搜索 */ 
/* 未 搬入 */ 

if (!InsertAVL(&(*T)->lchild, e, taller)) 
return FALSE; 

/* 已 插入 到 T 的 左 子 树 中 且 左 子 树 “长 高 ”*/ 

ih ( taller) 

















/* 检查 T 的 平衡 度 */ 
switch ((*T)->bf) 

















t 
/* 原本 左 子 树 比 右 子 树 高 ， 需 要 作 左 平衡 处 理 */ 

















case LH: 

LeftBalance(T); 

*taller = FALSE; 

break; 
/* 原本 左右 子 树 等 高 ， 现 因 左 子 树 增高 而 树 增高 */ 
case EH: 


CCT)=>bf = CH; 
*taller = TRUE; 











break; 
/* 原本 右 子 树 比 左 子 树 高 ， 现 左右 子 树 等 高 */ 
case RH: 


(*T)->bf = EH; 
*taller = FALSE; 
break; 

















/* 应 继续 在 T 的 右 子 树 中 进行 搜索 */ 














if (!InsertAVL(&(*T)->rchild, e, ta11er ) ) 
return FALSE: 

/* 已 插入 到 T 的 右 子 树 且 右 子 树 “ 长 高 ”*/ 

ia taller) 





























/* 检查 T 的 平衡 度 */ 
switch ((*T)->bf) 








{ 
/* 原本 左 子 樹 比 右 子 樹高 , 現 左 、 右 子 樹 等 高 */ 
case LH: 

(Gal) == bifie— EH, 

*taller = FALSE; 

break; 
/* 原本 左右 子 树 等 高 ， 现 因 右 子 树 增高 而 树 增高 */ 
case EH: 

(*T)->bf = RH; 

*taller = TRUE; 

break; 
/* 原本 右 子 树 比 左 子 树 高 ， 需 要 作 右 平衡 处 理 */ 
case RH: 

RightBalance(T); 

*taller = FALSE; 

break; 






































} 


} 
return TRUE; 


1. 程 序 开 始 执行 时 ， 第 3 一 10 行 是 指 当前 IT 为 空 时 ， 则 申请 内 存 新 增 一 个 
结 点 。 2. 第 13 一 17 行 表示 当 存 在 相同 结 点 ， 则 不 需要 插入 。 3. 第 18 一 40 
行 ， 当 新 结 点 e 小 于 T 的 根 结 点 值 时 ， 则 在 T 的 左 子 树 查 找 。 4. 第 20 一 21 
行 ， 递 归 调 用 本 函数 ， 直 到 找到 则 返回 false， 和 否则 说 明 插入 结 点 成 功 ， 








执行 下 面 语句 。 5. 第 22 一 39 行 ， 当 taller 为 TRUE 时 ， 说 明 插 入 了 结 点 ， 
此 时 需要 判断 工 的 平衡 因子 ， 如 果 是 1， 说 明 左 子 树 高 于 右 子 树 ， 需 要 调 
用 LeftBalance 函 数 进 行 左 平衡 旋转 处 理 。 如 果 为 0 或 -1， 则 说 明 新 插入 
结 点 没有 让 整 棵 二 叉 排序 树 失 去 平衡 性 ， 只 需要 修改 相关 的 BF 值 即 
可 。 6. 第 41 一 63 行 , WHIA Re KAFTAR, 在 T 的 右 子 樹 査 
找 。 代 码 上 述 类 似 ， 不 再 详 述 。 

















对 于 这 段 代 码 来 说 ， 我 们 只 需要 在 需要 构建 平衡 二 又 树 的 时 候 执行 如 下 
列 代码 即 可 在 内 存 中 生成 一 棵 与 图 8-7-4 的 图 2 相同 的 平衡 的 二 叉 树 。 


alae Abe 

‘inital [li] ae a eG eRe ORS 
BiTree T = NULL; 

Status taller; 

Hor (=O 1 <0 at) 


InsertAVL(&T, a[i], &taller); 





不 容易 ， 终 于 讲 完 了 ， 本 算法 代码 很 长 ， 是 有 些 复杂 ， 编 程 中 容易 在 很 
多 细节 上 出 错 ， 要 想 真 正 掌握 它 ， 需 要 同学 们 目 己 多 练习 。 不 过 其 思想 
还 是 不 难 理解 的 ， 总 之 束 是 把 不 平衡 消炎 在 最 早 时 刻 。 

















如 果 我 们 需要 僵 找 的 集合 本 里 没有 顺序 ， 在 频繁 查找 的 同时 也 需要 经 第 
的 插入 和 删除 操作 ， 显 然 我 们 需要 构建 一 株 二 又 排序 树 ， 但 是 不 平衡 的 
二 又 排序 树 ， 碍 找 效率 是 非常 低 的 ， 因 此 我 们 需要 在 构建 时 ， 就 让 这 榨 
二 又 排序 树 是 平衡 二 又 树 ， 此 时 我 们 的 查找 时 间 复 杂 度 就 为 Ddogn)， 而 
插入 和 删除 也 为 0dogn)。 这 显然 是 比较 理想 的 一 种 动态 查找 表 算 法 。 








8.8 ”多 路 查找 树 BH) 


台湾 出 版 人 何 飞 鹏 在 《 自 慢 》 书 中 曾经 有 这 样 的 文字 :“ 要 观察 一 个 公 
司 是 否 严 说 ， 看 他 们 如 何 开会 就 知道 了 。 如 果 开 会 时 每 一 个 人 都 只 是 市 
一 张嘴 ， 即 兴 发 言 ， 这 肯定 是 一 家 不 严谨 的 公司 ， 因 为 衣 定 每 一 个 人 都 
只 是 用 直 沉 与 反射 神经 在 互相 应 对 ， 不 可 能 有 深度 的 思考 与 规划 .…….， 
语言 是 沟通 的 工具 ， 文 字 是 记录 存 证 的 工具 ， 而 文字 化 的 过 程 ， 又 可 以 
让 思考 彻底 沉淀 ， 善 于 使 用 文字 的 人 ， 通 常 是 深沉 而 严谨 的 。” 显 然 ， 


























这 是 一 个 很 好 理解 的 观点 ， 但 许多 人 都 难以 做 到 筷 。 








图 8-8-1 


要 是 我 们 把 开会 比 作 内 存 中 的 数据 处 理 的 话 ， 那 么 写 下 来 和 时 第 阅读 它 
就 是 内 存 数据 对 外 存 磁盘 上 的 存 取 操 作 了 。 





内 存 一 般 都 是 由 硅 制 的 存储 必 片 组 成 ， 这 种 技术 的 每 一 个 存储 单位 代价 
都 要 比 磁 存储 技术 昂 吐 两 个 数量 级 ， 因 此 基于 磁盘 技术 的 外 存 ， 容 量 比 
内 存 的 容量 至 少 大 两 个 数量 级 。 这 也 就 是 目前 PC 通常 内 存 几 个 G 而 已 、 
而 人 硬盘 却 可 以 成 百 上 干 G 容 量 的 原因 。 














我 们 前 面 讨论 过 的 数据 结构 ， 处 理 数据 都 是 在 内 存 中 ， 因 此 考虑 的 都 是 
内 存 中 的 运算 时 间 复 杀 上 度 。 


但 如 大 我 们 要 操作 的 数据 集 非常 大 ， 大 到 内 存 已 经 没 办 法 处 理 了 怎么 办 
呢 ? 如 数据 库 中 的 上 千 万 条 记录 的 数据 表 、 硬 盘 中 的 上 万 个 文件 等 。 在 
E err mate 
FIN 9 


一 旦 涉及 到 这 样 的 外 部 存储 设备 ， 关 于 时 间 复 杂 度 的 计算 就 会 发 生变 
化 ， 访 问 该 集合 元 系 的 时 间 已 经 不 仅仅 是 寻找 该 元 素 所 需 比 较 次 数 的 函 
数 ， 我 们 必须 考虑 对 硬盘 等 外 部 存储 设备 的 访问 时 间 以 及 将 会 对 该 设备 
做 出 多 少 次 单独 访问 。 














试想 一 下 ， 为 了 要 在 一 个 拥有 几 十 万 个 文件 的 磁盘 中 查找 一 个 文本 文 
件 ， 你 设计 的 算法 需要 读 取 磁 盘 上 万 次 还 是 读 取 儿 十 次 ， 这 是 有 本 质 莽 
异 的 。 此 时 ， 为 了 降低 对 外 存 设 备 的 访问 次 数 ， 我 们 就 需要 新 的 数据 结 
构 来 处 理 这 样 的 问题 。 




















我 们 之 前 谈 的 树 ， 都 是 一 个 结 点 可 以 有 多 个 孩子 ， 但 是 它 目 身 只 存储 一 
个 元 率 。 二 又 树 限 制 更 多 ， 结 点 最 多 只 能 有 两 个 孩子 。 








一 个 结 把 只 能 存储 一 个 元 系 ， 在 元 素 非 常 多 的 时 候 ， 残 使 得 要 么 树 的 度 
非常 大 《 结 氮 拥有 子 树 的 个 数 的 最 大 值 ) ， 要 么 树 的 高 度 非常 大 ， 甚 至 
两 者 都 必须 足够 大 才 行 。 这 就 使 得 内 存 存 取 外 存 次 数 非 常 多， 这 显然 成 
本 时 间 效 紊 上 的 施 贷 ， 这 迫使 我 们 要 打破 每 一 个 结 点 只 存储 一 个 元 素 的 
限制 ， 为 此 引入 了 多 路 奉 找 树 的 概念 。 








多 路 查找 树 (muitl-way search tree) ， 其 每 一 个 结 点 的 孩子 数 可 以 多 于 
两 个 ， 且 每 一 个 结 点 处 可 以 存储 多 个 元 素 。 由 于 它 是 查找 树 ， 所 有 元 素 
之 间 存 在 某 种 特定 的 排序 关系 。 








在 这 里 ， 每 一 个 结 点 可 以 存储 多 少 个 元 际 ， 以 及 它 的 孩子 数 的 多 少 是 非 
。 为 此 ， 我 们 讲解 它 的 4 种 特殊 形式 : 2-3 树 、2-3-4 树 、B 树 和 
B+ 例 。 


8.8.1 2-3 村 





说 到 二 三 ， 我 就 会 想起 儿 时 的 童谣，“ 一 去 二 三 里 ， 烟 村 四 五 家 。 坚 台 
六 七 座 ， 八 九 十 文 花 。”2 和 3 是 最 基本 的 阿拉 伯 数 字 ， 用 它们 来 命名 一 
种 树 结 构 ， 显 然 是 说 明 这 种 结构 与 数字 2 和 3 有 密切 关系 。 





2-3 树 是 这 样 的 一 棵 多 路 碍 找 树 : 其 中 的 每 一 个 结 反 部 具有 两 个 孩子 
(我 们 称 它 为 2 结 点 ) 或 三 个 孩子 “我们 称 它 为 3 结 点 ) 。 


一 个 2 结 点 包含 一 个 元 素 和 两 个 孩子 (或 没有 孩子 ) ， 且 与 二 又 排序 树 
FAW, 左 子 樹 包 含 的 元素 小 干 協 元 率 , 右 子 樹 包 含 的 元素 大 十 頑 元素 。 
不 过 ， 与 二 又 排序 树 不 同 的 是 ， 这 个 2 结 点 要 么 没有 和 孩子， 要 有 就 有 两 
个 3 不 能 只 有 一 个 孩子 ， 

















一 个 3 结 点 包含 一 小 一 大 两 个 元 素 和 三 个 孩子 (或 没有 孩子 ) ， 一 个 3 结 
点 要 么 没有 孩子 ， 要 么 具有 3 个 孩子 。 如 果 某 个 3 结 点 有 孩子 的 话 ， 左 子 
树 包含 小 于 较 小 元 素 的 元 素 ， 右 子 树 包 含 大 于 较 大 元 素 的 元 素 ， 中 间 子 
树 包 含 介 于 两 元 素 之 间 的 元 素 。 














并 且 2-3 树 中 所 有 的 叶子 都 在 同一 层次 上 。 如 图 8-8-2 所 示 ， 束 是 一 棵 有 
效 的 2-3 树 。 





事实 上 ，2-3 树 复杂 的 地 方 就 在 于 新 结 点 的 插入 和 已 有 结 点 的 删除 。 毕 
竟 ， 每 个 结 点 可 能 是 2 结 点 也 可 能 是 3 结 点 ， 要 保证 所 有 叶子 都 在 同一 层 
次 ， 是 需要 进行 一 番 复 杂 操 作 的 。 
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2.3 枯 所 有 叶子 都 在 同一 层次 
图 8-8-2 
1. 2-3 树 的 插入 实现 


对 于 2-3 树 的 插入 来 说 ， 与 二 又 排序 树 相 同 ， 插 入 操作 一 定 是 发 生 在 叶 
子 结 点 上 。 可 与 二 又 排序 树 不 同 的 是 ，2-3 树 插入 一 个 元 素 的 过 程 有 可 
能 会 对 该 树 的 其 余 结构 产生 连锁 反应 。 


2-3 树 插入 可 分 为 三 种 情况 。 


1) 对 于 空 树 ， 插 入 一 个 2 结 点 即 可 ， 这 很 容易 理解 。 


2) 插入 结 点 到 一 个 2 结 点 的 叶子 上 。 应 该 说 ， 由 于 其 本 身 就 只 有 一 个 元 
素 ， 所 以 只 需要 将 其 升级 为 3 结 点 即 可 。 如 图 8-8-3 所 示 。 我 们 希望 从 左 
图 的 2-3 树 中 插入 元 素 3， 根 据 遍 历 可 知 ，3 比 8 小 、 比 4 小 ， 于 是 就 只 能 
考虑 插入 到 叶子 结 点 1 所 在 的 位 置 ， 因 此 很 自然 的 想法 就 是 将 此 结 点 变 
成 一 个 3 结 点 ， 即 右 图 这 样 完成 插入 操作 。 当 然 ， 要 视 插 入 的 元 素 与 当 
前 叶子 结 点 的 元 素 比较 大 小 后 ， 决 定 谁 在 左 谁 在 右 。 例 如 ， 若 插入 的 是 
0， 则 此 结 点 就 是 “0” 在 左 “1” 在 右 了 。 














图 8-8-3 





3) 要 往 3 结 点 中 插入 一 个 新 元 素 。 因 为 3 结 点 本 吴 已 经 是 2-3 树 的 结 点 最 
大 容量 (AAW Toc) ， 因 此 就 需要 将 其 拆 分 ， 且 将 树 中 两 元 素 或 
插入 元 素 的 三 者 中 选择 其 一 向 上 移动 一 层 。 复 杂 的 情况 也 正在 于 此 。 

















第 一 种 情况 ， 见 图 8-8-4， 需 要 问 左 图 中 插入 元 素 5。 经 过 遍历 可 得 到 元 
素 5 比 8 小 比 4 大 ， 因 此 它 应 该 是 需要 插入 在 拥有 6、7 元 素 的 3 结 点 位 置 。 
问题 束 在 于 ，6 和 7 结 点 已 经 是 3 结 点 ， 不 能 再 加 。 此 时 发 现 它 的 双亲 结 
点 4 是 个 2 结 点 ， 因 此 考虑 让 它 升级 为 3 结 点 ， 这 样 它 就 得 有 三 个 孩子 ， 
于 是 就 想到 ， 将 6、7 结 点 拆 分 ， 让 6 与 4 结 成 3 结 点 ， 将 5 成 为 它 的 中 间 孩 
子 ， 将 7 成 为 它 的 右 孩 子 ， 如 图 8-8-4 的 右 图 所 示 。 











图 8-8-4 








另 一 种 情况 ， 如 图 8-8-5 所 示 ， 需 要 癌 左 图 中 插入 元 素 11。 经 过 通 历 可 得 
到 元 素 11 比 12、14 小 比 9、10 大 ， 因 此 它 应 该 是 需要 插入 在 拥有 9、10 元 
素 的 3 结 点 位 置 。 同 样 道理 ，9 和 10 结 点 不 能 再 增加 结 点 。 此 时 发 现 它 的 
双亲 结 点 12、14 也 是 一 个 3 结 点 ， 也 不 能 再 插入 元 素 了 。 再 往 上 看 ， 

12、14 结 点 的 双亲 ， 结 点 8 是 个 2 结 点 。 于 是 就 想到 ， 将 9、10 拆 分 ， 
12、14 也 拆 分 ， 让 根 结 点 8 升级 为 3 结 点 ， 最 终 形成 如 图 8-8-5 的 右 图 样 
ee 








再 来 看 个 例子 ， 如 图 8-8-6 所 示 ， 需 要 在 左 图 中 插入 元 素 2。 经 过 遍历 可 
得 到 元 素 2 比 4 小 、6 比 1 大 ， 因 此 它 应 该 是 需要 插入 在 拥有 1、3 元 素 的 3 
结 点 位 置 。 与 上 例 一 样 ， 你 会 发 现 ，1、3 结 点 ，4、6 结 点 都 是 3 结 点 ， 

都 不 能 再 插入 元 素 了 ， 再 往 上 看 ，8、12 结 点 还 是 一 个 3 结 点 ， 那 就 意味 
着 ， 当 前 我 们 的 树 结构 是 三 层 已 经 不 能 满足 当前 结 点 增加 的 需要 了 。 于 
是 将 1、3 拆 分 ，4、6 拆 分 ， 连 根 结 点 8、12 也 拆 分 ， 最 终 形成 如 图 8-8-6 
的 右 图 样子 。 











图 8-8-6 


通过 这 个 例子 ， 也 让 我 们 及 现 ， 如 果 2-3 树 插入 的 传播 效应 导致 了 根 结 
点 的 拆 分 ， 则 树 的 高 度 就 会 增加 。 


2. 2-3 树 的 删除 实现 


对 于 2-3 树 的 删除 来 说 ， 如 果 对 前 面 插入 的 理解 足够 到 位 的 话 ， 应 该 不 
台 说 起 。 


1) 所 删除 元 素 位 于 一 个 3 结 扣 的 叶子 结 皮 上 ， ”这 非 第 简单 ， 只 需要 在 
该 结 点 处 删除 该 元 素 即 可 ， 不 会 影响 到 整 标 树 的 其 他 结 点 结构 。 如 网 8- 





8-7 所 示 ， 删 除 元 素 9， 只 需要 将 此 结 点 改 成 只 有 元 素 10 的 2 结 点 即 可 。 





图 8-8-7 





2) 所 删除 的 元 素 位 于 一 个 2 结 点 上 ， 即 要 删除 的 是 一 个 只 有 一 个 元 素 的 
结 点 。 如 果 按 照 以 前 树 的 理解 ， 删 除 即 可 ， 可 现在 的 2-3 树 的 定义 告诉 
我 们 这 样 做 是 不 可 以 的 。 比 如 图 8-8-8 所 示 ， 如 果 我 们 删除 了 结 点 1， 那 
么 结 扣 4 本 来 是 一 个 2 结 点 〈 它 拥有 两 个 孩子 )， 此 时 它 束 不 满足 定义 

fe 
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图 8-8-8 


因此 ， 对 于 删除 叶子 是 2 结 点 的 情况 ， 我 们 需要 分 四 种 情形 来 处 理 。 








情形 一 ， 此 结 扣 的 双亲 也 是 2 结 点 ， 且 拥 有 一 个 3 结 点 的 右 孩 子 。 如 图 8- 
8-9 所 示 ， 删 除 结 点 1， 那 么 只 需要 左旋 ， 即 6 成 为 双亲 ，4 成 为 6 的 左 孩 
子 ，7 是 6 的 右 孩子 。 











情形 二 ， 此 结 点 的 双 杀 是 2 结 点 ， 它 的 右 孩 子 也 是 2 结 点 。 如 图 8-8-10 所 
示 ， 此 时 删除 结 点 4， 如 果 直 接 左旋 会 造成 没有 右 孩 子 ， 因 此 需要 对 整 
棵 树 变 形 ， 办 法 就 是 ， 我 们 目标 是 让 结 点 7 变 成 3 结 点 ， 那 就 得 让 比 7 稍 
大 的 元 素 8 下 来 ， 随 即 就 得 让 比 元 素 8 稍 大 的 元 素 9 补 充 结 点 8 的 位 置 ， 于 
是 就 有 了 图 8-8-10 的 中 间 图 ， 于 是 再 用 左旋 的 方式 ， 变 成 右 图 结果 。 











图 8-8-10 


情形 三 ， 此 结 点 的 双亲 是 一 个 3 结 点 。 如 图 8-8-11 所 示 ， 此 时 删除 结 点 


10， 意 味 独 双 杀 12、14 这 个 络 点 不 能 成 为 3 结 点 了 ， 于 是 将 此 结 点 拆 
分 ， 并 将 12 与 13 合 并 成 为 左 孩 子 。 





图 8-8-11 


情形 四 ， 如 果 当 前 树 是 一 个 满 二 又 树 的 情况 ， 此 时 删除 任何 一 个 叶子 都 
会 使 得 整 棵 树 不 能 满足 2-3 树 的 定义 。 如 图 8-8-12 所 示 ， 删 除 叶 子 结 点 8 
时 《其 实 删除 任何 一 个 结 点 都 一 样 ) ， 就 不 得 不 考虑 要 将 2-3 的 层 数 减 
少 ， 办 法 是 将 8 的 双 杀 和 其 左 子 树 6 合 并 为 一 3 个 结 点 ， 再 将 14 与 9 合并 为 
3 结 点 ， 最 后 成 为 右 图 的 样子 。 





图 8-8-12 


3) 所 删除 的 元 系 位 于 非 叶子 的 分 支 结 点 。 此 时 我 们 通常 是 将 树 按 中 序 
避 历 后 得 到 此 元 系 的 前 驱 或 后 继 元 素 ， 考 虑 让 它们 来 补 位 即 可 。 








如 果 我 们 要 删除 的 分 支 结 点 是 2 结 点 。 如 图 8-8-13 所 示 我 们 要 删除 4 结 
点 ， 分 析 后 得 到 它 的 前 驱 是 1 后 继 是 6， 显 然 ， 由 于 6、7 是 3 结 点 ， 只 需 
要 用 6 来 补 位 即 可 ， 如 图 8-8-13 右 图 所 示 。 











图 8-8-13 


如 果 我 们 要 删除 的 分 支 结 点 是 3 结 点 的 某 一 元 素 ， 如 图 8-8-14 所 示 我 们 要 
删除 12、14 结 点 的 12， 此 时 ， 经 过 分 析 ， 显 然 应 该 是 将 是 3 结 点 的 左 孩 
子 的 10 上 升 到 删除 位 置 合 适 。 





图 8-8-14 


当然 ， 如 果 对 2-3 树 的 插入 和 删除 等 所 有 的 情况 进行 讲解 ， 既 占 篇 幅 ， 
又 没 必 要 ， 总 的 来 说 它 是 有 规律 的 ， 需 要 你 们 在 上 面 的 这 些 例子 中 多 去 
体会 后 掌握 。 


8.8.2 2-3-4 村 


有 了 2-3 树 的 讲解 ，2-3-4 树 就 很 好 理解 了 ， 它 其 实 就 是 2-3 树 的 概念 扩 
展 ， 包 括 了 4 结 反 的 使 用 。 一 个 4 结 点 包含 小 中 大 三 个 元 素 和 四 个 孩子 
(或 没有 孩子 ) ， 一 个 4 结 点 要 么 没有 孩子 ， 要 么 具有 4 个 孩子 。 如 果 茶 
个 4 结 反 有 孩子 的 话 ， 左 子 树 包 含 小 于 最 小 元 素 的 元 素 ; 第 二子 樹 包含 
大 于 最 小 元 系 ， 小 于 第 二 元 素 的 元 系 ; 第 三 子 树 包 含 大 于 第 二 元 素 ， 小 
于 最 大 元 素 的 元 素 ; 右 子 树 包 含 大 于 最 大 元 素 的 元 素 。 









































由 于 2-3-4 树 和 2-3 树 是 类 似 的 ， 我 们 这 里 就 简单 介绍 一 下 ， 如 果 我 们 构 
建 一 个 数组 为 {7,1,2,5,6,9,8,4,3} 的 2-3-4 树 的 过 程 ， 如 图 8-8-15 所 示 。 图 1 
是 在 分 别 插入 7、1、2 时 的 结果 图 ， 因 为 3 个 元 素 满足 2-3-4 树 的 单个 4 结 
点 定义 ， 因 此 此 时 不 需要 拆 分 ， 接 着 插入 元 素 5， 因 为 已 经 超过 了 4 结 点 
的 定义 ， 因 此 拆 分 为 图 2 的 形状 。 之 后 的 图 其 实 就 是 在 元 素 不 断 插 入 时 
最 后 形成 了 图 7 的 2-3-4 树 。 


图 8-8-15 


图 8-8-16 是 对 一 个 2-3-4 树 的 删除 结 点 的 演变 过 程 ， 删 除 顺序 是 1、6、 
oE a 
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图 8-8-16 


8.8.3 Bit 


我 们 本 节 名 称 叫 B 树 ， 但 到 了 现在 才 开 始 提 到 它 ， 似 乎 这 主角 出 来 的 实 
在 太 晚 了 ， 可 其 实 ， 我 们 前 面 一 直 都 在 讲 B 树 。 


B 树 (B-tree) 是 一 种 平衡 的 多 路 查找 树 ，2-3 树 和 2-3-4 树 都 是 B 树 的 特 
例 。 结 点 最 大 的 孩子 数 日 称 为 B 树 的 阶 Corder) ， 因 此 ，2-3 树 是 3 阶 B 
树 ，2-3-4 树 是 4 阶 B 树 。 


一 个 m 阶 的 B 树 具有 如 下 属性 : 





。 如 果 根 结 点 不 是 叶 结 点 ， 则 其 至 少 有 两 棵 子 树 。 

。 每 一 个 非 根 的 分 支 结 皮 都 有 k-1 个 元 系 和 k 个 孩子 ， 其 中 。 每 一 个 叶 
子 结 点 n 都 有 k-1 个 元 素 ， 其 中 。 

。 所 有 叶子 结 点 都 位 于 同一 层次 。 

。 所 有 分 支 结 点 包含 下 列 信息 数据 











(n,Ag,K1,A1,K9,A9,-..K, Ap) » 其 中 : K,(i=1,2,... WAKES, H 
Ki<Ki」」( デ 1.2,…。n-1), Ai(i=0,2,…,n) 为 指 癌 子 树 根 结 点 的 指针 ， 且 指针 A 


1 所 指 子 树 中 所 有 结 扣 的 关键 字 均 小 于 Ki(i=1,2,…,n)， 和 所 指 子 树 中 所 有 
结 点 的 关键 字 均 大 于 Kw，n(<n<m-1) 为 关键 字 的 个 数 〈 或 n+1 为 子 树 的 个 
数 ) 。 


例如 ， 在 讲 2-3-4 树 时 插入 9 个 数 后 的 图 转 成 B 树 示意 束 如 图 8-8-17 的 石 图 
所 示 。 左 侧 灰 色 方 块 表示 当前 结 点 的 元 素 个 数 。 
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图 8-8-17 
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在 B 树 上 得 找 的 过 程 是 一 个 顺 指 针 碍 找 结 点 和 在 结 点 中 碍 找 关 键 字 的 交 
又 过 程 。 


比方 说 ， 我 们 要 奏 找 数字 7， 首 先 从 外 存 《〈“ 比 如 硬盘 中 ) 读 取 得 到 根 结 
点 3、5、8 三 个 元 素 ， 发 现 7 不 在 当中 ， 但 在 5 和 8 之 间 ， 因 此 区 通过 A; 再 
读 取 外 存 的 6、7 结 把 ， 会 找到 所 要 的 元 素 。 


至 于 B 树 的 插入 和 删除 ， 方 式 是 与 2-3 树 和 2-3-4 树 相 类 似 的 ， 只 不 过 阶 数 
可 能 会 很 大 而 已 。 


我 们 在 本 市 的 开头 提 到 ， 如 果 内 存 与 外 存 交 换 数据 次 数 频 繁 ， 会 造成 了 
时 间 效 率 上 的 憩 贷 ， 那 么 B 树 结构 怎么 残 可 以 做 到 减少 次 数 呢 ? 





我 们 的 外 存 ， 比 如 硬盘 ， 是 将 所 有 的 信息 分 割 成 相等 大 小 的 页 面 ， 每 次 
硬盘 读 写 的 都 是 一 个 或 多 个 完整 的 页 面 ， 对 于 一 个 硬盘 来 说 ， 一 页 的 长 
度 可 能 是 211 到 214 个 字 节 。 





在 一 个 典型 的 B 树 应 用 中 ， 要 处 理 的 硬盘 数据 量 很 大 ， 因 此 无 法 一 次 全 
部 闭 入 内 存 。 因 此 我 们 会 对 B 树 进行 调整 ， 使 得 B 树 的 阶 数 《或 结 点 的 


TA) 与 硬盘 存储 的 页 面 大 小 相 匹配 。 比 如 说 一 棵 B 树 的 阶 为 1001 ( 即 1 
个 结 点 包含 1000 个 关键 字 ) ， 高 度 为 2， 它 可 以 储存 超过 10 亿 个 关键 
字 ， 我 们 只 要 让 根 结 点 持久 地 保留 在 内 存 中 ， 那 么 在 这 棵 树 上 ， 寻 找 某 
一 个 关键 字 至 多 需要 两 次 人 硬盘 的 读 取 即 可 。 这 就 好 比 我 们 普通 人 数 钱 都 
是 一 张 一 张 的 数 ， 而 银行 职员 数 钱 则 是 五 张 、 十 张 ， 甚 至 几 十 张 一 数 ， 
速度 当然 是 比 常 人 快 了 不 少 。 





通过 这 种 方式 ， 在 有 限 内 存 的 情况 下 ， 每 一 次 磁盘 的 访问 我 们 都 可 以 获 
得 最 大 数量 的 数据 。 由 于 B 树 每 结 点 可 以 具有 比 二 又 树 多 得 多 的 元 系 ， 
所 以 与 二 文 树 的 操作 不 同 ， 它 们 减少 了 必须 访问 结 点 和 数据 块 的 数量 ， 
al 性 能 。 可 以 说 ，B 树 的 数据 结构 就 是 为 内 外 存 的 数据 交互 准 














那么 对 了 a 个 关键 字 的 mB 鱼 ， 最 坏 情况 是 要 查找 几 次 呢 ? RIKI 
分 析 。 








第 一 层 至 少 有 1 个 结 点 ， 第 二 层 至 少 有 2 个 结 点 ， 由 于 除根 结 点 外 每 个 分 
支 结 点 至 少 有 |m/2| 棵 子 树 ， 则 第 三 层 至 少 有 2xlm/2| 个 结 点 ，.…..， 这 样 
第 k+1 层 至 少 有 2x(lmy2D*! 个 结 点 ， 而 实际 上 ，k+1 层 的 结 点 就 是 叶子 结 
点 。 若 m 阶 B 树 有 n 个 关键 字 ， 那 么 当 你 找到 了 叶子 结 点 ， 其 实 也 就 等 于 
查找 不 成 功 的 结 点 为 n+1， 因 此 n+1>2x(Im/2| 六 1， 即 : 
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也 就 是 说 ， 在 含有 n 个 关键 字 的 B 树 上 和 查找 时 ， 从 根 结 点 到 关键 字 结 点 的 
路 径 上 涉及 的 结 反 数 不 超 过 logjyy((n+1)/2)+1。 


8.8.4 B+ 


尽管 前 面 我 们 已 经 讲 了 B 树 的 诸多 好 处 ， 但 其 实 它 还 是 有 缺陷 的 。 对 于 
树 结 构 来 说， 我 们 都 可 以 通过 中 序 壳 历来 顺序 查找 树 中 的 元 素 ， 这 一 切 
都 是 在 内 存 中 进行 。 


可 是 在 B 树 结构 中 ， 我 们 往返 于 每 个 结 点 之 间 也 就 意味 着 ， 我 们 必须 得 
在 硬盘 的 页 面 之 间 进 行 多 次 访问 ， 如 图 8-8-18 所 示 ， 我 们 希望 遍历 这 棵 
B 树 ， 假 设 每 个 结 点 都 属于 硬盘 的 不 同 页 面 ， 我 们 为 了 中 序 遍 历 所 有 的 
元 素 ， 页 面 2 页面 1 页面 3- 页 面 1 一 页 面 4 一 页面 1 页 面 5。 而 且 我 
们 每 次 经 过 结 点 壳 历 时， 都 会 对 结 点 中 的 元 素 进行 一 次 遍历 ， 这 就 非常 
糟 米 。 有 没有 可 能 让 遍历 时 每 个 元 素 只 访问 一 次 呢 ? 
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图 8-8-18 


为 了 说 明 这 个 解决 的 办 法 ， 我 举 个 例子 。 一 个 优秀 的 企业 尽管 可 能 有 非 
种 成 熟 的 树 状 组 织 结构 ， 但 是 这 并 不 意味 看 员工 也 很 满意 ， 恰 恰 相 反 ， 

由 于 企业 管理 更 多 考虑 的 是 企业 的 利益 ， 这 惑 容易 忽略 员工 的 各 种 诉 

求 ， 造 成 了 管理 者 与 员工 之 间 的 矛盾 。 正 因为 此 ， 工 会 就 产生 了 ， 工 会 
原意 是 指 基 于 共同 利 苑 而 目 发 组 织 的 社会 团体 。 这 个 共同 利益 团体 诸如 
为 同一 雇主 工作 的 员工 ， 在 某 一 产业 领域 的 个 人 。 工 会 组 织 成 立 的 主要 
作用 ， 可 以 与 雇主 谈判 工资 薪水 、 工 作 时 限 和 工作 条 件 等 。 这 样 ， 其 实 























在 整个 企业 的 运转 过 程 中 ， 除 了 正规 的 层级 管理 外 ， 还 有 一 个 代表 员工 
的 团队 在 发 挥 男 外 的 作用 。 


同样 的 ， 为 了 能 够 解决 所 有 元 系 忆 历 等 基本 问题 ， 我 们 在 原 有 的 B 树 结 
构 基 础 上 ， 加 上 了 新 的 元 素 组 织 方 式 ， 这 就 是 B+ 树 。 








B+ 树 是 应 文件 系统 所 需 而 出 的 一 种 B 树 的 变形 树 ， 注 意 严 格 意 义 上 讲 ， 
它 其 实 已 经 不 是 第 六 章 定 义 的 树 了 。 在 B 权 中， 每 一 个 元 素 在 该 树 中 只 
出 现 一 次 ， 有 可 能 在 叶子 结 点 上 ， 也 有 可 能 在 分 支 结 点 上 。 而 在 B+ 树 
中 ， 出 现在 分 支线 氮 中 的 元 素 会 被 当 作 它们 在 该 分 文 结 点 位 置 的 中 序 后 
继 者 《叶子 结 点 ) 中 再 次 列 出 。 男 外 ， 每 一 个 叶子 结 点 都 会 保存 一 个 指 
向 后 一 叶 子 策 点 的 指針 。 





例如 图 8-8-19 所 示 ， 就 是 一 棵 B+ 树 的 示意 ， 灰 色 关 键 字 即 是 根 结 点 中 的 
关键 字 在 叶子 结 反 再 次 列 出 ， 并 且 所 有 叶子 结 点 都 链接 在 一 起 。 





图 8-8-19 


一 棵 m 阶 的 B+ 树 和 m 阶 的 B 树 的 差异 在 于 : 


。 有 mn 株 子 树 的 结 点 中 包含 有 n 个 关键 字 ; 

。 所 有 的 叶子 结 点 包含 全 部 关键 字 的 信息 ， 及 指 癌 含 这 些 关 键 字 记录 
的 指针 ， 叶 子 结 氮 本 号 依 关键 字 的 大 小 目 小 而 大 顺序 链接 ; 

。 所 有 分 支 结 点 可 以 看 成 是 索引 ， 结 点 中 仅 含 有 其 子 树 中 的 最 大 《或 
最 小 ) 关键 字 。 








这 样 的 数据 结构 最 大 的 好 处 束 在 于 ， 如 果 是 要 随机 碍 找 ， 我 们 就 从 根 结 
点 出 发 ， 与 B 树 的 查找 方式 相同 ， 只 不 过 即使 在 分 文 结 点 找到 了 符 得 找 
的 关键 字 ， 它 也 只 是 用 来 索引 的 ， 不 能 提供 实际 记录 的 访问 ， 还 是 需要 
到 达 包 含 此 关键 字 的 终端 结 点 。 





如 末 我 们 是 需要 从 最 小 关键 字 进 行 从 小 到 大 的 顺序 得 找 ， 我 们 就 可 以 从 
最 左 侧 的 叶子 结 点 出 发 ， 不 经 过 分 文 结 点 ， 而 是 延 着 指 问 下 一 叶子 的 指 
针 就 可 遍历 所 有 的 关键 字 。 


B+ 树 的 结构 特别 适合 带 有 范围 的 查找。 比如 查找 我 们 学 校 18~~22 岁 的 
学 生 人 数 ， 我 们 可 以 通过 从 根 结 反 出 友 找 到 第 一 个 18 岁 的 学 生 ， 然 后 再 
在 叶子 绩 点 按 顺 序 碍 找到 符合 范围 的 所 有 记录 。 


B+ 树 的 插入 、 删 除 过 程 也 都 与 B 树 类 似 ， 只 不 过 插入 和 删除 的 元 系 都 是 
在 叶子 结 点 上 进行 而 已 。 


8.9” 散 列表 查找 〈( 哈 希 表 )〉 概述 





在 本 章 前 面 的 顺序 表 查 找 时 ， 我 们 曾经 说 过 ， 如 果 你 要 查找 某 个 关键 字 
的 记录 ， 就 是 从 表 头 开始 ， 挨 个 的 比较 记录 af 与 key 的 值 是 “=” 还 

是 “z”， 直 到 有 相等 才 算 是 查找 成 功 ， 返 回 i[。 到 了 有 序 表 查 找 时 ， 我 们 
可 以 利用 af[ij 与 key 的 “<? 或 >” 来 折 半 查找 ， 直 到 相等 时 查找 成 功 返回 i。 
最 终 我 们 的 目的 都 是 为 了 找到 那个 ij， 其 实 也 就 是 相对 的 下 标 ， 再 通过 
顺序 存储 的 存储 位 置 计算 方法 ，LOC(aj)=LOC(aj) 十 (i-1)xc， 也 就 是 通过 
第 一 个 元 素 内 存 存储 位 置 加 上 i-1 个 单元 位 置 ， 得 到 最 后 的 内 存 地 址 。 




















此 时 我 们 发 现 ， 为 了 查找 到 结果 ， 之 前 的 方法 “比较 "都 是 不 可 避免 的 ， 
但 这 是 否 真 的 有 必要 ?能 否 直接 通过 关键 字 key 得 到 要 查找 的 记录 内 存 
存储 位 置 呢 ? 








8.9.1 ” 散 列 表 查 找 定 义 





试想 这 样 的 场景 ， 你 很 想 学 太极 拳 ， 听 说 学 校 有 个 叫 张三丰 的 人 打 得 特 
别 好 ， 于 是 你 到 学 校 学 生 处 找 人 ， 学 生 处 的 工作 人 员 可 能 会 拿 出 学 生 名 
单 ， 一 个 一 个 的 查找 ， 最 终 告诉 你 ， 学 校 没 这 个 人 ， 并 说 张三丰 几 百 年 
前 就 已 经 在 武当 山 作 二 了。 可 如 果 你 找 对 了 人 ， 比 如 在 操场 上 找 那 些 爱 
运动 的 同学 ， 人 家 会 告诉 你 ，“ 哦 ， 你 找 张三丰 呀 ， 有 有 有 ， 我 带 你 
去 。» 于 是 他 把 你 带 到 了 体育 馆 内 ， 并 告诉 你 ， 那 个 教 大 家 打 太极 的 小 
伙 子 就 是 “张三丰 ”， 原 来 "张三丰 "是 因为 他 太极 拳 打 得 好 而 得 到 的 外 
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图 8-9-1 





学 生 处 的 老师 找 张 三 丰 ， 那 就 是 顺序 表 碍 找 ， 依 赖 的 是 姓名 关键 字 的 比 
Ro MWR ESN SIN, RAM, RAR, BST 
们 “和 欲 找 太极 张三丰 ”， 必 在 体育 馆 当 中 ”的 经 验 ， 直 接 告诉 你 位 置 。 





也 就 是 说 ， 我 们 只 需要 通过 有 个 函数 f， 使 得 





存储 位 置 =f (REF) 








那样 我 们 可 以 通过 得 找 头 键 字 不 需 a 要 的 记录 的 存储 位 
置 。 这 就 是 一 种 新 的 存 人 





散 列 技术 是 在 记录 的 存储 位 置 和 它 的 关键 字 之 间 建 立 一 个 确定 的 对 应 关 
系 f， 使 得 每 个 关键 字 key 对 应 一 个 存储 位 置 f (key) 。 查 找 时 ， 根 据 这 
个 确定 的 对 应 关系 找到 给 定 值 key 的 映射 f (key〉， 若 查找 集合 中 存在 
这 个 记录 ， 则 必定 在 f (key) 的 位 置 上 。 





这 里 我 们 把 这 种 对 应 关系 f 称 为 散 列 函数 ， 义 称 为 哈 希 (Hash)〉 函 数 。 
J 采用 散 列 技术 将 记录 存储 在 一 块 连续 的 存储 空间 中 ， 这 块 
续 存 储 空间 称 为 散 列 表 或 哈 希 表 (Hash table) 。 那 么 关键 字 对 应 的 
we A HERAT 称 为 散 列 地 址 。 


8.9.2” 散 列表 查找 步 又 


整个 散 列 过 程 其 实 就 是 两 步 。(1) 在 存储 时 ， 通 过 散 列 函数 计算 记录 
的 散 列 地 址 ， 并 按 此 散 列 地 址 存储 该 记录 。 就 像 张三丰 我 们 就 让 他 在 体 
育 馆 ， 那 如 果 是 ' 爱 因 斯 坦 ' 我 们 让 他 在 图 书馆 ， 如 果 是 “大里 夫人 ，， 那 
就 让 她 在 化 学 实验 室 ， 如 果 是 ‘巴顿 将 军 ，"， 这 个 打仗 的 将 军 一 一 我 们 可 
以 让 他 到 网 吧 。 总 之 ， 不 管 什 么 记录 ， 我 们 都 需要 用 同一 个 散 列 函数 计 
算出 地 址 再 存储 。 








图 8-9-2 (2) 当 碍 找 记 录 时 ， 我 们 通过 同样 的 散 列 函数 计算 记录 的 散 列 
地 址 ， 按 此 散 列 地 址 访问 该 记录 。 说 起 来 很 简单 ， 在 哪 存 的 ， 上 哪 去 
找 ， 由 于 存 取 用 的 是 同一 个 散 列 函数 ， 因 此 结果 当然 也 是 相同 的 。 


所 以 说 ， 散 列 技术 既是 一 种 存储 方法 ， 也 是 一 种 查找 方法 。 然 而 它 与 线 








性 表 、 树 、 图 等 结构 不 同 的 是 ， 前 面 几 种 结构 ， 数 据 元 素 之 间 都 存在 某 
种 逻辑 关系 ， 可 以 用 连 线 图 示 表 示 出 来 ， 而 散 列 技术 的 记录 之 间 不 存在 
I IS ON 
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散 列 技术 最 适合 的 求解 问题 是 但 找 与 给 定 值 相 等 的 记录 。 对 于 但 找 来 
说 ， 简 化 了 比较 过 程 ， 效 率 就 会 大 大 提高 。 但 万 事 有 利 残 有 兹 ， 散 列 技 
术 不 具备 很 多 津 规 数据 结构 的 能 











比如 那 种 同样 的 关键 字 ， 它 能 对 应 很 多 记录 的 情况 ， 却 不 适合 用 散 列 技 
术 。 一 个 班级 几 十 个 学 生 ， 他 们 的 性 别 有 男 有 女 ， 你 用 关键 字 “ 男 ?去 得 
找 ， 对 应 的 有 许多 学 生 的 记录 ， 这 显然 是 不 合适 的 。 只 有 如 用 班级 学 生 
的 学 号 或 者 号 份 证 号 来 散 列 存储 ， 此 时 一 个 号 码 唯一 对 应 一 个 学 生 才 比 


较 合 适 。 














同样 散 列 表 也 不 适合 范围 查找 ， 比 如 查找 一 个 班级 18 一 22 岁 的 同学 ， 在 
散 列表 中 没 法 进行 。 想 获得 表 中 记录 的 排序 也 不 可 能 ， 像 最 大 值 、 基 小 
值 等 结果 也 都 无 法 从 散 列表 中 计算 出 来 。 








我 们 说 了 这 么 多 ， 散 列 函 数 应 该 如 何 设计 ? 这 个 我 们 需要 重点 来 讲解， 
人 
I 问题 。 


为 一 个 问题 是 冲突 。 在 理想 的 情况 下 ， 每 一 个 关键 字 ， 通 过 散 列 函数 计 
算出 来 的 地 址 都 是 不 一 样 的 ， 可 现实 中 ， 这 只 是 一 个 理想 。 我 们 时 常会 
位 到 两 个 关键 字 key1zkey,，， 但 是 却 有 f(key1)=f(key,)， 这 种 现象 我 们 称 
为 冲突 (colli-sion〉， 并 把 key1 和 key, 称 为 这 个 散 列 函数 的 同义词 
(synonym) 。 出 现 了 冲突 当然 非常 糟 粽 ， 那 将 造成 数据 查找 错误 。 尺 
管 我 们 可 以 通过 精心 设计 的 散 列 函数 让 冲突 尽 可 能 的 少 ， 但 是 不 能 完 
避免 。 于 是 如 何 处 理 冲突 就 成 了 一 个 很 重要 的 座 题 ， 这 在 我 们 后 面 也 需 
要 详细 讲解 。 





8.10” 散 列 函数 的 构造 方法 


不 管 做 什么 事 要 达到 最 优 都 不 容易 ， 既 要 付出 尽 可 能 的 少 ， 叉 要 得 到 最 
II 


1. 计算 简单 


你 资 设计 一 个 算法 可 以 保证 所 有 的 关键 字 都 不 会 产生 冲突 ， 但 是 这 个 算 
法 需要 很 复杂 的 计算 ， 会 耗费 很 多 时 间 ， 这 对 于 需要 频繁 地 查找 来 说 ， 
就 会 大 大 降低 得 找 的 效率 了 。 因 此 散 列 函数 的 计算 时 间 不 应 该 超过 其 他 
查找 技术 与 关键 字 比 较 的 时 间 。 


2. 散 列 地 址 分 布 均匀 


我 们 刚才 也 提 到 冲突 带 来 的 问题 ， 最 好 的 办 法 束 是 尽量 让 散 列 地 址 均匀 
地 分 布 在 存储 空间 中 ， 这 样 可 以 保证 存储 空间 的 有 效 利用 ， 并 减少 为 处 
理 冲 突 而 耗费 的 时 间 。 





接 下 来 我 们 束 要 介绍 几 种 种 用 的 散 列 函数 构造 方法 。 佑 计 设 计 这 些 方法 
的 前 府 们 当年 可 能 是 从 事 间 读 工作 ， 因 为 这 些 方 法 都 是 将 原来 数字 按 东 
种 规律 变 成 男 一 个 数字 而 已 。 








8.10.1 直接 定 址 法 





如 果 我 们 现在 要 对 0 一 100 岁 的 人 口 数 字 统 计 表 ， 如 表 8-10-1 所 示 ， 那 么 
我 们 对 年 龄 这 个 关键 字 就 可 以 直接 用 年 龄 的 数字 作为 地 址 。 此 时 
f(key)=key. 


表 8-10-1 


地 址 “年龄 人 数 


0 0500 万 

1600 万 
2 2450 万 
2020 15005 


如 果 我 们 现在 要 统计 的 是 80 后 出 生年 份 的 人 口 数 ， 如 表 8-10-2 所 示 ， 那 
么 我 们 对 出 生年 份 这 个 关键 字 可 以 用 年 份 减 去 1980 来 作为 地 址 。 此 时 
f(key)=key-1980. 


表 8-10-2 


地 址 出生 年 俗人 数 
0 1980 1500 万 
1 1981 1600 万 
2 1982 1300 万 


也 就 是 说 ， 我 们 可 以 取 关 键 字 的 条 个 线性 函数 值 为 散 列 地 址 ， 即 


f(key)=axkey+b (a、b 为 常数 ) 





这 样 的 散 列 函数 优点 就 是 简单 、 均 匀 ， 也 不 会 产生 冲突 ， 但 问题 是 这 需 
要 事先 知道 天 键 字 的 分 布 情况 ， 适 合 查 找 表 较 小 且 连 续 的 情况 。 由 于 这 
样 的 限制 ， 在 现实 应 用 中 ， 此 方法 虽然 简单 ， 但 却 并 不 和 常用。 


8.10.2 数 字 分 析 法 


如 果 我 们 的 关键 字 是 位 数 较 多 的 数字 ， 比 如 我 们 的 11 位 手机 

号 “130xxxx1234”， 其 中 前 三 位 是 接 入 号 ， 一 般 对 应 不 同和 运营 丙 公 司 的 
子 品 牌 ， 如 130 是 联通 如 意 通 、136 是 移动 神州 行 、153 是 电信 等 ， 中 间 
四 位 是 HLR 识 别 号 ， 表 示 用 户 号 的 归属 地 ; 后 四 位 才 是 真正 的 用 户 号 ， 
如 表 8-10-3 所 示 。 
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130xxxx1234 






易 重 复 分 布 太 集 ; 分 布 均匀 ， 可 
中 某 几 个 数字 | 月 作 散 列 地 址 
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表 8-10-3 














车 我 们 现在 要 存储 某 家 公司 员工 登记 表 ， 如 果 用 手机 号 作为 关键 字 ， 那 
么 极 有 可 能 前 7 位 都 是 相同 的 。 那 么 我 们 选择 后 面 的 四 位 成 为 散 列 地 址 
就 是 不 错 的 选择 。 如 果 这 样 的 抽取 工作 还 是 容易 出 现 冲 突 问题 ， 还 可 以 
对 抽取 出 来 的 数字 再 进行 反 转 〈 如 1234 改 成 4321) 、 右 東 位 移 ( 如 1234 








改 成 4123) 、 左 环 位 移 、 甚 至 前 两 数 与 后 两 数 登 加 ( 如 1234 改 成 
12+34=46) 等 方法 。 总 的 目的 就 是 为 了 提供 一 个 散 列 函数 ， 能 够 合理 地 
将 关键 字 分 配 到 散 列表 的 各 位 置 。 


这 里 我 们 提 到 了 一 个 关键 词 一 一 抽取 。 抽 取 方 法 是 使 用 关键 字 的 一 部 分 
来 计算 散 列 存储 位 置 的 方法 ， 这 在 散 列 函数 中 是 常 第 用 到 的 手段 。 





数字 分 析 法 通常 适合 处 理 关 键 字 位 数 比 较 大 的 情况 ， 如 果 事 先知 道 关 键 
字 的 分 布 且 关 键 字 的 耕 干 位 分 布 较 均匀 ， 就 可 以 考虑 用 这 个 方法 。 





8.10.3 平方 取 中 法 


这 个 方法 计算 很 简单 ， 假 设 关 键 字 是 1234， 那 么 它 的 平方 就 是 
1522756， 再 抽取 中 间 的 3 位 就 是 227， 用 做 散 列 地 址 。 再 比如 关键 字 是 
4321， 那 么 它 的 平方 就 是 18671041， 抽 取 中 间 的 3 位 束 可 以 是 671， 也 可 
以 是 710， 用 做 散 列 地 址 。 平 方 取 中 法 比较 适合 于 不 知道 关键 字 的 分 
布 ， 而 位 数 又 不 是 很 大 的 情况 。 


8.10.4 JÆ 


MEREK RETAZE IE ot El BO SSN JLB or (注意 最 后 一 部 分 
位 数 不 够 时 可 以 短 些 ) ， 然 后 将 这 几 部 分 登 加 求 和 ， 并 按 散 列 表 表 长 ， 
取 后 儿 位 作为 散 列 地 址 。 





比如 我 们 的 关键 字 是 9876543210， 散 列表 表 长 为 三 位 ， 我 们 将 它 分 为 四 
组 ，987|654|321|0， 然 后 将 它们 对 加 求 和 987+654+321+0=1962， 再 求 后 
3 位 得 到 散 列 地 址 为 962。 


AR NY AY BET AN BES PRED TALS), AN A tg Fa) Sa i HE TL St Ss OT 
齐 相 加 。 比 如 我 们 将 987 和 321 反 转 ， 再 与 654 和 0 相 加 ， 变 成 
789+654+123+0=1566， 此 时 散 列 地 址 为 566。 





折 营 法 事先 不 需要 知道 关键 字 的 分 布 ， 适 合 关 键 字 位 数 较 多 的 情况 。 


8.10.5 除 留 余 数 法 


此 方法 为 最 常用 的 构造 散 列 函数 方法 。 对 于 散 列 表 长 为 m 的 散 列 函数 公 


式 为 : 
f(key)=key mod p(p<m) 


mod 是 取 模 ( 求 余数 ) 的 意思 。 事 实 上 ， 这 方法 不 仅 可 以 对 关键 字 直 接 
取 模 ， 也 可 在 折合 、 平 方 取 中 后 再 取 模 。 


很 显然 ， 本 方法 的 关键 就 在 于 选择 合适 的 p，p 如 果 选 得 不 好 ， 就 可 能 会 
容易 产生 同义词 


例如 表 8-10-4， 我 们 对 于 有 12 个 记录 的 关键 字 构 造 散 列表 时 ， 就 用 了 
MO) 
立 置 。 


w PPS sawp 








不 过 这 也 是 存在 冲突 的 可 能 的 ， 因 为 12=2x6=3x4。 如 果 关 键 字 中 有 像 
18(3x6)、30(5x6)、42(7x6) 等 数字 ， 它 们 的 余数 都 为 6， 这 就 和 78 所 对 应 
的 下 标 位 置 冲突 了 。 








甚至 极端 一 些 ， 对 于 表 8-10-5 的 关键 字 ， 如 果 我 们 让 p 为 12 的 话 ， 就 可 能 
出 现下 面 的 情况 ， 所 有 的 关键 字 都 得 到 了 0 这 个 地 址 数 ， 这 未 免 也 太 精 








EE EC 


表 8-10-5 


我 们 不 选用 p=12 来 做 除 留 余数 法 ， 而 选用 p=11， 如 表 8-10-6 所 示 。 


Fa [1] 2/3) 4] 5] 6] 7] 8] 9] oy of i 


ib [12 4] 96 | 48 eo | 72/84] 96 | 108 | 120) 132 | 1a 


图 8-10-6 








此 就 只 有 12 和 144 有 冲突 ， 相 对 来 说 ， 束 要 好 很 多 。 











因此 根据 前 厘 们 的 经 验 ， 辱 散 列 表 表 长 为 nm， 通常 p 为 小 于 或 等 于 表 长 
( 最 好 接近 m) 的 最 小 质数 或 不 包含 小 于 20 质 因子 的 合 数 。 


8.10.6 随 机 数 法 


逃 振 一介 随 机 数 , IEF IN ENR AEA Eas. that 
f(key)=random(key)。 这 里 random 是 随机 函数 。 当 关键 字 的 长 度 不 等 
时 ， 采 用 这 个 方法 构造 散 列 函数 是 比较 合适 的 。 


有 同学 问 ， 那 如 果 关 键 字 是 字符 串 如 何 处 理 ? 其 实 无 论 是 英文 字符 ， 还 
是 中 文字 符 ， 也 包括 各 种 各 样 的 符号 ， 它 们 都 可 以 转化 为 某 种 数字 来 对 
待 ， 比 如 ASCII 码 或 者 Unicode 码 等 ， 因 此 也 就 可 以 使 用 上 面 的 这 些 方 

法 。 





总 之 ， 现 实 中 ， 应 该 视 不 同 的 情况 采用 不 同 的 散 列 函数 。 我 们 只 能 给 出 
一 些 考虑 的 因素 来 提供 参考 : 1. 计 算 散 列 地 址 所 需 的 时 间 。 2. 关 键 字 的 
KÆ. 3. 散 列表 的 大 小 。 4. 关 键 字 的 分 布 情 况 。 5. 记 录 碍 找 的 频率 。 纤 
合 这 些 因 素 ， 才 能 决策 选择 哪 种 散 列 函数 更 合适 。 


8.11 处理 散 列 冲突 的 方法 


我 们 每 个 人 都 硕 望 喘 体 健 康 ， 虽 然 疾病 能 够 预防 ， 但 是 不 可 避免 ， 没 有 
任何 成 年 人 生 下 来 到 现在 没有 生 过 一 次 病 。 


从 刚才 除 留 余数 法 的 例子 也 可 以 看 出 ， 我 们 设计 得 再 好 的 散 列 函数 也 不 
可 能 完全 避免 冲突 ， 这 就 像 我们 再 健康 也 只 能 尽量 预防 疾病 ， 但 却 无 法 
保证 永远 不 得 病 一 样 ， 既 然 冲 突 不 能 避免 ， 就 要 考虑 如 何 处 理 它 。 





那么 当 我 们 在 使 用 散 列 函数 后 发 现 两 个 关键 字 keyizkey;， 但 是 却 有 
fkey)=fkey)， 即 有 冲突 时 ， 怎 么 办 呢 ? 我 们 可 以 从 生活 中 找寻 思路 。 


试想 一 下 ， 当 你 观望 很 久 很 信 ， 终 于 看 上 一 套房 打算 要 买 了 ， 正 准备 下 
订金 ， 人 家 告诉 你 ， 这 房子 已 经 被 人 买 走 了 ， 你 怎么 办 ? 


再 找 别 的 房子 喘 ! 这 其 实 就 是 一 种 处 理 冲突 的 方法 一 一 开放 定 址 
as 


8.11.1 开放 定 址 法 


所 谓 的 开放 定 址 法 就 是 一 旦 发 生 了 冲突 ， 就 去 寻找 下 一 个 空 的 散 列 地 
址 ， 只 要 散 列 表 足 够 大 ， 空 的 散 列 地 址 总 能 找到 ， 并 将 记录 存 入 。 


它 的 公式 是 : 
fi(key)=(f(key)+di)MOD m(dj=1,2,3,......, m-1 ) 


比如 说 ， 我 们 的 关键 字 集合 为 {12,67,56,16,25,37,22,29,15,47,48,34}， 表 
长 为 12。 我 们 用 散 列 函数 f(key)=key mod 12. 


当 计 算 前 5 个 数 {12,67,56,16,25} 时 ， 都 是 没有 冲突 的 散 列 地 址 ， 直 接 存 
A, 如 表 8-11-1 所 示 。 


Fa [0] 1/2]3] 4] 5/6] 7] 8]9 | tof 





rite [2] 5) | 6 | fords | 


表 8-11-1 








计算 key=37 时 ， 发 现 f(37)=1， 此 时 就 与 25 所 在 的 位 置 冲 突 。 于 是 我 们 应 
用 上 面 的 公式 f(37)=((37)+1)mod 12=2。 于 是 将 37 存 入 下 标 为 2 的 位 置 。 
这 其 实 束 是 房子 被 人 买 了 于 是 买 下 一 间 的 作法 ， 如 表 8-11-2 所 示 。 


Uo 











meres fel | Tals [al 


表 8-11-2 


接 下 来 22.29,15,47 都 没有 沖 突 , 正常 的 存 入 , 如 表 8-11-3 所 示 。 


a | 0] 1/2] 3) 4] spe 7] 8] 9] 10] 





eae [sD] sw [| [so] [aa 


表 8-11-3 


到 了 key=48， 我 们 计算 得 到 f(48)=0， 与 12 所 在 的 0 位 置 冲突 了 ， 不 要 
紧 ， 我 们 f(48)=(f(48)+1)mod ”12=1， 此 时 又 与 25 所 在 的 位 置 冲突 。 于 是 
f(48)=(f(48)+2)mod 12=2， 还 是 冲突 ...... 一 直到 f(48)=(f(48)+6)mod 12=6 
时 ， 才 有 空位 ， 机 不 可 失 ， 赶 快 存 入 ， 如 表 8-11-4 所 示 。 





了 0] 1] 2/3] 4] 3] 6] eoon 





表 8-11-4 


我 们 把 这 种 解决 冲突 的 开放 定 址 法 称 为 线性 探测 法 。 


从 这 个 例子 我 们 也 看 到 ， 我 们 在 解决 冲突 的 时 候 ， 还 会 碰 到 如 48 和 37 这 
种 本 来 都 不 是 同义词 却 需要 争夺 一 个 地 址 的 情况 ， 我 们 称 这 种 现象 为 堆 
只 。 很 显然 ， 堆 积 的 出 现 ， 使 得 我 们 需要 不 断 处 理 冲 突 ， 无 论 是 存 入 还 
EARI KRKK EE 





考虑 深 一 步 ， 如 果 发 生 这 样 的 情况 ， 当 最 后 一 个 key=34，f(key)=10， 与 
22 所 在 的 位 置 冲 突 ， 可 是 22 后 面 没 有 空位 置 了 ， 反 而 它 的 前 面 有 一 个 空 
位 置 ， 尽 管 可 以 不 断 地 求 余 数 后 得 到 结果 ， 但 效率 很 差 。 因 此 我 们 可 以 





改进 di=1.,-1,2,-2……..,qo-qz(q<m/2)， 这 样 就 等 于 是 可 以 双向 寻找 到 可 
能 的 空位 置 。 对 于 34 来 说 ， 我 们 取 d 











i=-1 即 可 找到 空位 置 了 。 男 外 增加 平方 运算 的 目的 是 为 了 不 让 关键 字 都 
聚集 在 某 一 块 区 域 。 我 们 称 这 种 方法 为 二 次 探测 法 。 


fi(key )=(f(Key )+di )MOD m(dj=12, - 12, 22, -22, ・・・/ q2, -d2, dSm/2 ) 








还 有 一 种 方法 是 ， 在 冲突 时 ， 对 于 位 移 量 di 采用 随机 函数 计算 得 到 ， 我 
们 称 之 为 随机 探测 法 。 


此 时 一 定 有 人 问 ， 既 然 是 随机 ， 那 么 查找 的 时 候 不 也 随机 生成 d 吗 ? 如 
何 可 以 获得 相同 的 地 址 呢 ? 这 是 个 问题 。 这 里 的 随机 其 实 是 伪 随 机 数 。 
伪 随 机 数 是 说 ， 如 果 我 们 设置 随机 种 子 相同 ， 则 不 断 调用 随机 函数 可 以 
生成 不 会 重复 的 数列 ， 我 们 在 查找 时 ， 用 同样 的 随机 种 子 ， 它 每 次 得 到 
的 数列 是 相同 的 ， 相 同 的 di 当然 可 以 得 到 相同 的 散 列 地 址 。 








ME? 随机 种 子 义 不 知道 ? 坪 了 去 了 ， 不 懂 的 还 是 去 查阅 资料 吧 ， 我 不 能 
在 读 上 没完 没 了 的 介绍 这 些 基础 知识 呀 。 


fi(key)=(f(key)+di)MOD m(dj 是 一 个 随机 数列 ) 


总 之 ， 开 放 定 址 法 只 要 在 散 列 表 未 填 满 时 ， 总 是 能 找到 不 发 生 冲 突 的 地 
址 ， 是 我 们 第 用 的 解决 冲突 的 办 法 。 


8.11.2 再 散 列 函数 法 


我 们 继续 用 买房 子 来 举例 ， 如 果 你 看 房 时 的 选择 标准 总 是 以 市 中 心 、 交 
通 便利 、 价 格 适中 为 指标 ， 这 样 的 房子 凤毛麟角 ， 基 本 上 当 你 看 到 时 ， 
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宜 很 多 ， 也 许 房 子 还 可 以 买 得 大 一 些 、 质 量 
房 的 想法 ， 很 快 就 找到 了 你 需要 的 房子 了 。 





对 于 我 们 的 散 列 表 来 说 ， 我 们 事先 准备 多 个 散 列 函数 。 


fi(key )=RHi(key)(1=1, 2, .,k) 


这 里 RHi 就 是 不 同 的 散 列 函数 ， 你 可 以 把 我 们 前 面 说 的 什么 除 留 余 数 、 
折 膨 、 平 方 取 中 全 部 用 上 。 每 当 发 生 散 列 地 址 冲突 时 ， 就 换 一 个 散 列 函 
BUTE, 相信 总 会 有 一 个 可 以 把 冲突 解决 扭 。 这 种 方法 能 够 使 得 关键 字 
不 产生 聚集 ， 当 然 ， 相 应 地 也 增加 了 计算 的 时 间 。 


8.11.3” 链 地 址 法 


思路 还 可 以 再 换 一 换 ， 为 什么 有 冲突 束 要 换 地 方 呢 ， 我 们 直接 就 在 原 地 
想 办 法 不 可 以 吗 ? 于 是 我 们 就 有 了 链 地 址 法 。 











将 所 有 关键 字 为 同义词 的 记录 存储 在 一 个 单 链表 中 ， 我 们 称 这 种 表 为 同 
义 词 子 表 ， 在 散 列 表 中 只 存储 所 有 同义词 子 表 的 头 指 针 。 对 于 关键 字 集 
合 {12,67,56,16,25,37,22,29,15,47,48,34}， 我 们 用 前 面 同样 的 12 为 除数 ， 
进行 除 留 余 数 法 ， 可 得 到 如 图 8-11-1 结 构 ， 此 时 ， 忆 经 不 存在 什么 冲突 
换 址 的 问题 ， 无 论 有 多 少 个 冲突 ， 都 只 是 在 当前 位 置 给 单 链 表 增 加 结 点 


的 问题 。 
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图 8-11-1 


链 地 址 法 对 于 可 能 会 造成 很 多 冲突 的 散 列 函数 来 说 ， 提 供 了 绝 不 会 出 现 
PR 0 R E 
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8.11.4 公共 溢出 区 法 


这 个 方法 其 实 就 更 加 好 理解 ， 你 不 是 冲突 吗 ? 好 吧 ， 凡 是 冲突 的 都 跟 我 
走 ， 我 给 你 们 这 些 冲 突 找 个 地 儿 竺 着。 这 就 如 同 孤 儿 院 收留 所 有 无 家 可 
E 
放 。 





就 前 面 的 例子 而 言 ， 我 们 共有 三 个 关键 字 {37,48,34} 与 之 前 的 关键 字 位 
置 有 冲突 ， 那 么 残 将 它们 存储 到 洲 出 表 中 ， 如 图 8-11-2 所 示 。 


ご 








基本 表 


图 8-11-2 


在 查找 时 ， 对 给 定 值 通过 散 列 函 数 计算 出 散 列 地 址 后 ， 先 与 基本 表 的 相 
应 位 置 进行 比 对 ， 如 果 相 等 ， 则 查找 成 功 ， 如 果 不 相 等 ， 则 到 溢出 表 去 
进行 顺序 查找 。 如 果 相 对 于 基本 表 而 言 ， 有 冲突 的 数据 很 少 的 情况 下 ， 
公共 洲 出 区 的 结构 对 碍 找 性 能 来 说 还 是 非常 高 的 。 








8.12 BARAK 
说 了 这 么 多 散 列 表 碍 找 的 思想 ， 我 们 就 来 看 看 查找 的 实现 代码 。 


8.12.1 散 列 表 查 找 算 法 实现 





首先 是 需要 定义 一 个 散 列 表 的 结构 以 及 一 些 相 关 的 种 数 。 其 中 
HashTable 就 是 散 列 表 结 构 。 结 构 当 中 的 elem 为 一 个 动态 数组 。 


#define SUCCESS 1 

#define UNSUCCESS 0 

/* 定义 散 列表 长 为 数组 的 长 度 */ 
#define HASHSIZE 12 
#define NULLKEY -32768 
typedef struct 











/* 数据 元 素 存储 基 址 ， 动 态 分 配 数组 */ 
int *elem; 
/* 当前 数据 元 素 个 数 */ 
int count; 
} HashTable; 
/* BARK, 全局 変量 */ 


SURE i =O 


























有 了 结构 的 定义 ， 我 们 可 以 对 散 列 表 进 行 初 始 化 。 


/* 初 始 化 散 列表 */ 
Status InitHashTable(HashTable *H) 


TME 
m = HASHSIZE; 
H->count = m; 
H->elem = (int *)malloc(m * sizeof(int)); 
ROP Cle Soe np st) 
H->elem[i] = NULLKEY; 
return OK; 
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情況 更改 算法 。 


/* 散 列 函数 */ 
int Hash(int key) 


/* 除 留 余数 法 */ 


return key % m; 








初始 化 完成 后 ， 我 们 可 以 对 散 列 表 进 行 插入 操作 。 假 设 我 们 插入 的 关键 
字 集 合 就 是 前 面 的 {12,67,56,16,25,37,22,29,15,47,48,34}。 























/* 插入 关键 字 进 散 列表 */ 
void InsertHash(HashTable *H, int key) 
{ 





/* 求 散 列 地 址 */ 

int addr = Hash(key); 

/* 如 果 不 为 空 ， 则 冲突 */ 

while (H->elem[addr] != NULLKEY) 
/* 开放 定 址 法 的 线性 探测 */ 
addr = (addr + 1) % m; 

/* 直到 有 空位 后 插入 关键 字 */ 

H->elem[addr] = key; 
































代码 中 插入 关键 字 时 ， 首 移 算 出 散 列 地 址 ， 如 果 当 前 地 址 不 为 空 关 键 
字 ， 则 说 明 有 冲突 。 此 时 我 们 应 用 开放 定 址 法 的 线性 探测 进行 重新 寻 
址 ， 此 处 也 可 更 改 为 链 地 址 法 等 其 他 解决 冲突 的 办 法 。 


散 列表 存在 后 ， 我 们 在 需要 时 就 可 以 通过 散 列 表 奉 找 要 的 记录 。 


/* 散 列 表 査 扱 共 筆 字 */ 
Status SearchHash(HashTable H, int key, int *addr) 


{ 
/* 求 散 列 地 址 */ 
*addr = Hash(key); 
/* 如 果 不 为 空 ， 则 冲突 */ 
while (H.elem[*addr] != key) 








/* 开放 定 址 法 的 线性 探测 */ 
*addr = (*addr + 1) % m; 
if (H.elem[*addr] == NULLKEY || *addr == Hash(key)) 











/* 如果 循 下 回 色 原点 */ 
/* 则 说 明 关 键 字 不 存在 */ 
return UNSUCCESS; 














— SUCCESS; 
查找 的 代码 与 插入 的 代码 非常 类 似 ， 只 需 做 一 个 不 存在 关键 字 的 判断 而 
回 


8.12.2 HIRA ERE REI HT 


最 后 ， 我 们 对 散 列 表 查 找 的 性 能 作 一 个 简单 分 析 。 如 果 没 有 冲突 ， 散 列 
查找 是 我 们 本 章 介 绍 的 所 有 得 找 中 效率 最 高 的 ， 因 为 它 的 时 间 复 杂 上 度 为 
O(1)。 可 惜 ， 我 说 的 只 是 “如 果 ”， 没 有 冲突 的 散 列 只 古 一 种 理想 ， 在 实 
际 的 应 用 中 ， 冲 突 是 不 可 避免 的 。 那 么 散 列 查找 的 平均 僵 找 长 上 度 取 决 于 
哪些 因素 呢 ? 


1. 散 列 函数 是 否 均匀 





散 列 函 数 的 好 坏 和 直接 影响 着 出 现 冲 突 的 频 党 程度， 不过， 由 于 不 同 的 散 
列 函数 对 同一 组 随机 的 关键 字 ， 产 生 冲 突 的 可 能 性 是 相同 的 ， 因 此 我 们 
可 以 不 考虑 它 对 平均 查找 长 度 的 影响 。 





2. 处 理 冲突 的 方法 


相同 的 关键 字 、 相 同 的 散 列 函数 ， 但 处 理 冲突 的 方法 不 同 ， 会 使 得 平均 
查找 长 度 不 同 。 比 如 线性 探测 处 理 冲突 可 能 会 产生 堆积 ， 显 然 就 没有 二 
次 探测 法 好 ， 而 链 地 址 法 处 理 冲突 不 会 产生 任何 堆积 ， 因 而 具有 更 佳 的 
平均 查找 性 能 。 








3. 散 列 表 的 装填 因子 








所 谓 的 装填 因子 a= 填 入 表 中 的 记录 个 数 / 散 列 表 长 度 。o 标 志 独 散 列 表 的 
装 满 的 程度 。 妆 填 入 表 中 的 记录 越 多 ，o 束 越 大 ， 产 生 冲 突 的 可 能 性 残 


越 大 。 比 如 我 们 前 面 的 例子 ， 如 图 8-11-5 所 示 ， 如 果 你 的 散 列表 长 度 是 
12， 而 填 入 表 中 的 记录 个 数 为 11， 那 么 此 时 的 装填 因子 
a=11/12=0.9167， 再 填 入 最 后 一 个 关键 字 产 生 冲 突 的 可 能 性 就 非常 之 
大 。 也 就 是 说 ， 散 列表 的 平均 查找 长 度 取 诀 于 装填 因子 ， 而 不 是 取决 于 
查找 集合 中 的 记录 个 数 。 








不 管 记录 个 数 n 有 多 大 ， 我 们 总 可 以 选择 一 个 合适 的 装填 因子 以 便 将 平 
均 碍 找 长 度 限 定 在 一 个 范围 之 内 ， 此 时 我 们 散 列 碍 找 的 时 间 复 杂 度 束 真 
(NEO) 了。 为 了 做 到 这 一 点 ， 通 利 我 们 都 是 将 散 列 表 的 空间 设置 得 比 
查找 集合 大 ， 此 时 虽然 是 浪费 了 一 定 的 空间 ， 但 换 来 的 是 查找 效率 的 大 
大 提升 ， 总 的 来 说 ， 还 是 非常 值得 的 。 








8.13 总 结 回 顾 





我 们 这 一 章 全 都 是 围绕 一 个 主题 “查找 ”来 作文 章 的 。 

















首先 我 们 要 弄 清楚 奋 找 表 、 记 录 、 关 键 字 、 主 关键 字 、 静 态 碍 找 表 、 动 
态 查 找 表 等 这 些 概念 。 

















然后 ， 对 于 顺序 表 奏 找 来 说 ， 尽 管 很 士 《 简 单 ) ， 但 它 却 是 后 面 很 多 得 
找 的 基础 ， 注 意 设置 “哨兵 ”的 技巧 ， 可 以 使 得 本 已 经 很 难 提升 的 简单 算 
法 里 还 是 提高 了 性 能 。 








有 序 人 查找， 我 们 着 重 讲 了 折 半 全 找 的 思想 ， 它 在 性 能 上 比 原来 的 顺序 伍 
找 有 了 质 的 飞跃 ， 由 O(n) 变 成 了 O(logn)。 之 后 我 们 又 讲解 了 另外 两 种 优 
RR 
THES. 
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被 广泛 的 用 于 文件 检索 、 数 据 库 和 搜索 引擎 等 技术 领域 ， 是 进一步 学 习 
这 些 技术 的 基础 。 








二 又 排序 树 是 动态 奏 找 最 重要 的 数据 结构 ， 它 可 以 在 兼 顾 查 找 性 能 的 基 
础 上 ， 让 插入 和 删除 也 变 得 效率 较 高 。 不 过 为 了 达到 最 优 的 状态 ， 二 又 
排序 树 最 好 是 构造 成 平衡 的 二 又 树 才 最 佳 。 因 此 我 们 束 需 要 再 学 习 关 于 
平衡 二 又 树 〈AVL 树 ) 的 数据 结构 ， 了 解 AVL 树 是 如 何 处 理 平 衡 性 的 问 


题 。 这 部 分 是 本 章 重 点 ， 需要 认真 学 习 掌 握 。 
































B 树 这 种 数据 结构 是 针对 内 存 与 外 存 之 间 的 存 取 而 专门 设计 的 。 由 于 内 
外 存 的 查找 性 能 更 多 取决 于 读 取 的 次 数 ， 因 此 在 设计 中 要 考虑 B 树 的 平 
衡 和 层次 。 我 们 讲解 时 是 先 通 过 最 最 简单 的 B 树 (2-3 树 〉 来 理解 如 何 构 
建 、 插 入 、 删 除 元 素 的 操作 ， 再 通过 2-3-4 树 的 深化 ， 最 终 来 理解 B 树 的 
原理 。 之 后 ， 我 们 还 介绍 了 B+ 树 的 设计 思想 。 








散 列 表 是 一 种 非常 高 效 的 查找 数据 结构 ， 在 原理 上 也 与 前 面 的 查找 不 尽 
相同 ， 它 回避 了 关键 字 之 间 反 复 比 较 的 烦琐 ， 而 是 直接 一 步 到 位 碍 找 结 
果 。 当 然 ， 这 也 束 带 来 了 记录 之 间 没 有 任何 关联 的 次 端 。 应 该 说 ， 散 列 
表 对 于 那 种 仁 找 性 能 要 求 高 ， 记 录 之 间 关 系 无 要 求 的 数据 有 非常 好 的 适 
用 性 。 在 学 习 中 要 注意 的 是 散 列 函数 的 选择 和 处 理 冲 突 的 方法 。 








8.14 结尾 语 


我 们 的 “Search” 技 术 探索 之 旅 结束 了 ， 但 也 许 ， 你 们 对 它 的 探索 才刚 刚 
开始 。 我 们 在 开篇 时 谈 到 了 搜索 引擎 改变 了 我 们 的 生活 ， 让 我 们 获得 信 
恩 的 速度 提升 了 无 数 倍 。 可 是 当前 像 Google 这 样 的 搜索 引擎 ， 是 否 就 完 
FTIR W? 未 来 的 搜索 应 该 义 是 什么 样 的 ? 在 本 章 的 最 后 ， 我 根据 了 
解 到 的 信息 给 大 家 做 一 个 抛砖引玉 。 





目前 流行 的 搜索 引擎 ， 都 是 一 个 搜索 框 可 以 搜索 一 切 信息 。 这 本 是 好 事 
情 ， 可 问题 在 于 币 种 在 我 们 输入 关键 词 后 ， 搜 索 获 得 的 前 面 几 十 条 都 不 
AMEN, MRS BE. 
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活动 的 新 闻 等 信息 。 有 一 天 ， 我 想 了 解 老 席 伍 效 最 近 有 哪些 比赛 ， 于 是 
在 搜索 框 中 输入 了 “老虎 *， 却 得 到 了 图 8-14-1 所 示 的 结果 。 








老虎 Google 搜索 
#3 16600.00 R85 (Bet 0.05 #) snaz 


AR GE. SpR 





QF AIG... Gi (tger) ) ARAM HELA REAR RAN Z-» B55 
亚洲 现存 的 处 二 食物链 项 这 的 食肉 动物 之 一 ， 才 高 提 有 物料 动物 中 最 长 的 大 齿 、,。 
IMEX - TA - EMRA- RNRP 


baike.baidu,com/view!17319.htm - 网 由 快照 -类似 结果 


者 让 - nae 
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图 8-14-1 


显然 这 并 不 是 我 所 希望 得 到 的 答案 。 你 们 可 能 会 说 ， 那 是 因为 你 的 搜索 
关键 词 不 够 好 造成 的 ， 应 该 输入 “老虎 伍兹 ”更 恰当 。 可 问题 的 关键 在 
于 ， 融 算 我 输入 了 了 “ 老 席 伍 效 "， 搜 索引 擎 是 否 知道 ， 我 最 感 兴趣 的 是 高 
尔 夫 运动 员 比 赛 信息 ， 而 非 他 和 老婆 离婚 等 八卦 新 闻 呢 ? 如 图 8-14-2 所 
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需 排 名 首位 ， 并 被 公认 为 史上 最 成 功 的 高 尔 夫 球 手 之 一 。，。 
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图 8-14-2 





如 于 未 来 的 搜索 引擎 在 我 授权 的 情况 下 ， 记 录 我 平时 的 搜索 喜好 ， 调 整 
搜索 内 容 的 优先 度 ， 并 把 我 可 能 想 了 解 的 信息 放 在 前 列 ， 这 样 也 许 就 不 
至 村 产生 找 伍 效 给 只 大 老 谋 的 困惑 了 。 





呵呵 ! 如 果 我 是 个 喜欢 汽车 的 人 ， 时 常 搜 汽 车 信息 。 那 么 当 我 在 搜索 框 
中 输入 “甲壳 虫 "、“ 美 训 席 “林肯 ”“ 福 特 ” 等 关键 词 时 ， 不 要 让 动物 
和 人 物 成 为 搜索 的 头条 。 哪 伯 是 输入 “QQ” 时 ， 搜 索引 擎 也 应 该 将 奇瑞 
汽车 而 不 是 腾讯 IM 列 在 首位 。 进 一 步 ， 如 果 我 喜欢 汽车 图 片 ， 搜 索引 

擎 就 首先 提供 相关 的 汽车 图 片 ， 我 更 关注 新 闻 ， 它 就 所 供 最 新 的 汽车 新 
闻 ， 我 关注 价格 ， 那 就 提供 相关 型 号 车 子 的 市 场 报价 。 当 然 ， 其 他 相关 
信息 并 不 是 不 提供 了 ， 只 不 过 在 排序 上 应 该 相对 徘 后 而 已 。 这 样 整 个 搜 
索 的 体验 就 会 非常 好 了 ， 也 许 我 总 能 在 前 几 条 就 能 找到 我 想 了 解 的 内 

容 。 











好 了 ， 这 个 话题 一 展开 就 没完 疫 了 了 。 也 许 不 久 的 将 来 ,“ 你 一 动 念 
头 ， 搜 索 结 末 就 会 冒 出 来 ”成 为 真 的 现实 ， 那 真是 太 棒 了 。 在 座 各 位 ， 
好 好 努力 吧 。 下 诬 ! 





第 9 草 排序 


启示 

排序 : 

假设 含有 n 个 记录 的 序列 为 {rir2,.……， rm}， 其 相应 的 关键 字 分 别 为 
{kk2,….…kn}， 需 确定 1,2,.…...,n 的 一 种 排列 pi,p2,….……,pn， 使 其 相应 的 关 


键 字 满 足 ky1<ko2<.…..<k,。( 非 递减 或 非 递增 关系 ， 即 使 得 序列 成 为 一 
个 按 关键 字 有 序 的 序列 fruro rn}， 这 样 的 操作 就 称 为 排序 。 


9.1 开场 白 





大 家 好 ! 你 们 有 没有 在 网 上 买 过 东西 啊 ? 


HE? 居然 还 有 人 次 没有 。 了 呵呵 ， 在 座 的 都 是 大 学 生 ， 应 该 很 多 同学 都 有 
过 网 购 的 经 历 。 哪 介 真 的 没有 ， 也 看 到 或 听 到 过 一 些 ， 现 在 网 上 购物 已 
经 相对 成 熟 ， 对 用 户 来 说 带 来 了 很 大 的 方便 。 


假如 我 想 买 一 台 iPhone4 的 手机 ， 于 是 上 了 某 电子 商务 网 站 去 搜索 。 可 
搜索 后 发 现 〈( 如 图 9-1-1 所 示 ) ， 有 8863 个 相关 的 物品 ， 如 此 之 多 ， 这 叫 
我 如 何 选择 。 我 其 实 是 想 买 便宜 一 点 的 ， 但 是 又 怕 遇 到 骗子 ， 想 找 信誉 
好 的 商家 ， 如 何 做 ? 
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图 9-1-1 





下 面 的 有 些 购物 达 人 给 我 出 主意 了 ， 排 序 呀 。 对 呀 ， 排 序 就 行 了 (如 图 
9-1-2 所 示 ) 。 我 完全 可 以 根据 目 己 的 需要 对 搜索 到 的 商品 进行 排序 ， 比 
如 按 信用 从 高 到 低 、 再 按 价格 从 低 到 高 ， 将 最 符合 我 预期 的 商品 列 在 前 
面 ， 最 终 找 到 我 愿意 购买 的 商家 ， 非 党 的 方便 。 











rr ems C 也 二 | wae |e 
cilia ML 
Whaat 





# ¥ 5669.00 GT) 
AOD | BAREN 


iphone 4 代 (326) # ¥ 6690.00 
SHANE Retna NR SOUR L. mamn | ap sens 


网 入 类 型 ; WCDMA(36) AIMES: Elie ERRT: 3387 | FRSA: 16007 


baal 





图 9-1-2 





网 站 是 如 何 做 到 快速 地 将 商品 按 某 种 规则 有 序 的 呢 ? 这 就 是 我 们 今天 要 
讲解 的 重要 课题 一 一 排序 。 


9.2 ”排序 的 基本 概念 与 分 类 


排序 是 我 们 生活 中 经 常会 面 对 的 问题 。 同学 们 做 操 时 会 按照 从 碟 到 高 拓 
列 ; 老师 俘 看 上 谍 出 勤 情况 时 ， 会 按 学 生 学 写 顺 序 点 名 ; 局 考 录取 时 ， 
会 按 成 绩 总 分 降序 依次 录取 等 。 那 排序 的 严格 定义 是 什么 呢 ? 

















假设 含有 n 个 记录 的 序列 为 Trurz…rm}， 其 相应 的 关键 字 分 别 为 
{kk ki}， 需 确定 12,…n 的 一 种 排列 pp>….pn， 使 其 相应 的 关 
键 字 满足 kpiskp2<.……<kbn《〈 非 递减 或 非 递增 ) 关系 ， 即 使 得 序列 成 为 一 
个 按 关 键 字 有 序 的 序列 {rmpbrm2……Tpnj， 这 样 的 操作 就 称 为 排序 。 











注意 我 们 在 排序 问题 中 ， 通 常 将 数据 元 素 称 为 记录 。 显 然 我 们 输入 的 是 
一 个 记录 集合 ， 输 出 的 也 是 一 个 记录 和 集合， 所 以 说 ， 可 以 将 排序 看 成 是 
线性 表 的 一 种 操作 。 


排序 的 依据 是 关键 字 之 间 的 大 小 和 关系， 那么 ， 对 同一 个 记录 集合 ， 针 对 
不 同 的 关键 字 进 行 排序 ， 可 以 得 到 不 同 序列 。 

















这 里 关键 字 k 可 以 是 记录 r 的 主 关 键 字 ， 也 可 以 是 次 关键 字 ， 甚 至 是 各 干 
数据 项 的 组 合 。 比 如 我 们 某 些 大 学 为 了 选拔 在 主 科 上 更 优秀 的 学 生 ， 要 
求 对 所 有 学 生 的 所 有 科目 总 分 降序 排名 ， 并 且 在 同样 总 分 的 情况 下 将 语 
数 外 总 分 做 降序 排名 。 这 就 是 对 总 分 和 语 数 外 总 分 两 个 次 关键 字 的 组 合 
排序 。 如 图 9-2-1 所 示 ， 对 于 组 合 排序 的 问题 ， 当 然 可 以 先 排序 总 分 ， 若 
总 分 相等 的 情况 下 ， 再 排序 语 数 外 总 分 ， 但 这 是 比较 土 的 办 法 。 我 们 还 
可 以 应 用 一 个 技巧 来 实现 一 次 排序 即 完成 组 合 排序 问题 ， 例 如 ， 把 总 分 
与 语 数 外 都 当成 字符 串 首尾 连接 在 一 起 (注意 语 数 外 总 分 如 果 位 数 不 够 
三 位 ， 需 要 在 前 面 补 零 ) ， 很 容易 可 以 得 到 令狐冲 的 “753229” 要 小 于 张 
元 忌 的 "753236”, 于 是 张无忌 就 排 在 了 令狐冲 的 前 面 。 
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图 9-2-1 


从 这 个 例子 也 可 看 出 ， 多 个 关键 字 的 排序 最 终 都 可 以 转化 为 单个 关键 字 
的 排序 ， 因 此 ， 我 们 这 里 主要 讨论 的 是 单个 关键 字 的 排序 。 


9.2.1 排序 的 稳定 性 








也 正 是 由 于 排序 不 仅 是 针对 主 关 键 字 ， 那 么 对 于 次 关键 字 ， 因 为 符 排 序 
的 记录 序列 中 可 能 存在 两 个 或 两 个 以 上 的 关键 字 相 等 的 记录 ， 排 序 结 果 
可 能 会 存在 不 唯一 的 情况 ， 我 们 给 出 了 稳定 与 不 稳定 排序 的 定义 。 











假设 ki=k(1<isn,1<j<n 这 ) ， 且 在 排序 前 的 序列 中 领先 于 i<j) 。 
如 朵 排序 后 ti 仍 领先 于 rr， 则 称 所 用 的 排 友 方法 是 稳定 的 ; 有 反之 ， 右 可 能 
使 得 排序 后 的 序列 中 rt; 领先 rn， 则 称 所 用 的 排序 方法 古 不 稳定 的 。 如 图 9- 
2-2 所 示 ， 经 过 对 总 分 的 降序 排序 后 ， 总 分 高 的 排 在 前 列 。 此 时 对 于 令 
狐 冲 和 张无忌 而 言 ， 未 排序 时 是 令狐冲 在 前 ， 那 么 它们 总 分 排序 后 ， 分 
数 相等 的 令狐冲 依然 应 该 在 前 ， 这 样 才 算 是 稳定 的 排序 ， 如 果 他 们 二 者 
颠倒 了 ， 则 此 排序 是 不 稳定 的 了 。 只 要 有 一 组 关键 字 实 例 发 生 类 似 情 
TT a 
百 才 能 得 出 。 
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图 9-2-2 


9.2.2 ”内 排序 与 外 排序 








根据 在 排序 过 程 中 竺 排序 的 记录 是 否 全 部 被 放置 在 内 存 中 ， 排 序 分 为 : 
内 排序 和 外 排序 。 


内 排序 是 在 排序 整个 过 程 中 ， 待 排序 的 所 有 记录 全 部 被 放置 在 内 存 中 。 
外 排序 是 由 于 排序 的 记录 个 数 太 多 ， 不 能 同时 放置 在 内 存 ， 整 个 排序 过 
程 需 要 在 内 外 存 之 间 多 次 交换 数据 才能 进行 。 我 们 这 里 主要 束 介 绍 内 排 
序 的 多 种 方法 。 








对 于 内 排序 来 说 ， 排 序 算法 的 性 能 主要 是 受 3 个 方面 影响 : 


1. 时 间 性 能 


排序 是 数据 处 理 中 经 常 执行 的 一 种 操作 ， 往 往 属 于 系统 的 核心 部 分 ， 因 
此 排序 算法 的 时 间 开 销 是 衡量 其 好 坏 的 最 重要 的 标志 。 在 内 排序 中 ， 主 
要 进行 两 种 操作 比较 和 移动 。 比 较 指 关键 字 之 间 的 比较 ， 这 是 要 做 排 
序 最 起 码 的 操作 。 移 动 指 记录 从 一 个 位 置 移 动 到 力 一 个 位 置 ， 事 实 上 ， 
移动 可 以 通过 改变 记录 的 存储 方式 来 予以 避免 (这 个 我 们 在 讲解 具体 的 
算法 时 再 谈 ) 。 总 之 ， 高 效率 的 内 排序 算法 应 该 是 具有 尽 可 能 少 的 关键 
字 比 较 次 数 和 尽 可 能 少 的 记录 移动 次 数 。 





2. 辅助 空间 





评价 排序 算法 的 力 一 个 主要 标准 是 执行 算法 所 需要 的 辅助 存储 空间 。 辅 
助 存 储 空 间 是 除了 存放 符 排 序 所 占用 的 存储 空间 之 外 ， 执 行 算 法 所 需要 
的 其 他 存储 空间 。 


3. 算法 的 复杂 性 











注意 这 里 指 的 是 算法 本 号 的 复杂 度 ， 而 不 是 指 算法 的 时 间 复 杂 度 。 显 然 
算法 过 于 复杂 也 会 影响 排序 的 性 能 。 





根据 排序 过 程 中 借助 的 主要 操作 ， 我 们 把 内 排序 分 为 : 插入 排序 、 交 换 
排序 、 选 择 排序 和 归并 排序 。 可 以 说 ， 这 些 都 是 比较 成 熟 的 排序 技术 ， 
己 经 被 广泛 地 应 用 于 许 许 多 多 的 程序 语言 或 数据 库 当 中 ， 甚 至 它们 都 已 
经 封装 了 关于 排序 算法 的 实现 代码 。 因 此 ， 我 们 学 习 这 些 排序 算法 的 目 
的 更 多 并 不 是 为 了 去 在 现实 中 编程 排序 算法 ， 而 是 通过 学 习 来 提高 我 们 
编写 算法 的 能 力 ， 以 便于 去 解决 更 多 复杂 和 灵活 的 应 用 性 问题 。 























本 章 一 共 要 讲解 七 种 排序 的 算法 ， 按 照 算 法 的 复杂 上 度 分 为 两 大 类 ， 冒 泡 
排序 、 简 单 选择 排序 和 直接 插入 排 厅 属于 简单 算法 ， 而 布尔 排序 、 堆 排 
序 、 归 并 排序 、 快 速 排序 属于 改进 算法 。 后 面 我 们 将 依次 讲解 。 








9.2.3 ”排序 用 到 的 结构 与 函数 


为 了 讲 清楚 排序 算法 的 代码 ， 我 先 提供 一 个 用 于 排序 用 的 顺序 表 结 构 ， 
此 结构 也 将 用 于 之 后 我 们 要 讲 的 所 有 排序 算法 。 





























/* 用 于 要 排序 数组 个 数 最 大 值 ， 可 根据 需要 修改 */ 
#define MAXSIZE 10 

typedef struct 

{ 









































/* 用 于 存储 要 排序 数组 ，r [90] 用 作 哨 兵 或 临时 变量 */ 
int r[MAXSIZE + 1]: 























/* 用 于 记录 顺序 表 的 长 度 */ 
int length; 
} sqgirst; 


另外 ， 由 于 排序 最 最 常用 到 的 操作 是 数组 两 元 素 的 交换 ， 我 们 将 它 写 成 
函数 ， 在 之 后 的 讲解 中 会 大 量 的 用 到 。 


/* 交换 L 中 数组 r 的 下 标 为 i 和 j 的 值 */ 


void swap(SqList *L, int i, int j) 








int temp = L->r[i]; 
L->r[i] = L->r[j]; 
L->r[j] = temp; 


好 了 ， 说 了 这 么 多 ， 我 们 来 看 第 一 个 排序 算法 。 


9.3 Sia 


无 论 你 学 习 哪 种 编程 语言 ， 在 学 到 循环 和 数组 时 ， 通 常 都 会 介绍 一 种 排 
序 算法 来 作为 例子 ， 而 这 个 算法 一 般 就 是 冒 泡 排 序 。 并 不 是 它 的 名 称 很 
好 听 ， 而 是 说 这 个 算法 的 思路 最 简单 ， 最 容易 理解 。 因 此 ， 哪 但 大 家 可 
能 都 已 经 学 过 冒 泡 排序 了 ， 我 们 还 是 从 这 个 算法 开始 我 们 的 排序 之 旅 。 








图 9-3-1 


9.3.1 最 简单 排序 实现 


冒 泡 排序 (Bubble Sort) 一 种 交换 排序 ， 它 的 基本 思想 是 ;两 两 比较 相 
邻 记录 的 关键 字 ， 如 果 反 序 则 交换 ， 直 到 没有 反 序 的 记录 为 止 。 冒 泡 的 
实现 在 细节 上 可 以 有 很 多 种 变化 ， 我 们 将 分 别 就 3 种 不 同 的 冒 泡 实现 代 
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/* 对 顺序 表 L 作 交换 排序 ( 冒 泡 排序 初级 版 ) */ 
void BubbleSort0(SqList *L) 
{ 
oi ne ale af 
Role. (Gi alee ng ar] 
for (j = i+ 1; j <= L->length; j++) 
ab le) 
{ 
/* 交換 L->r[1] 与 L->r[]] 的 値 */ 
swap(L, i, j); 
} 
} 


+ 
+ 


这 段 代码 严格 意义 上 说 ， 不 算是 标准 的 冒 泡 排序 算法 ， 因 为 它 不 满 

足 “ 两 两 比较 相 邻 记录 ”的 冒 泡 排序 思想 ， 它 更 应 该 是 最 最 简单 的 交换 排 
序 而 已 。 筷 的 思路 就 是 让 每 一 个 关键 字 ， 都 和 它 后 面 的 每 一 个 关键 字 比 
较 ， 如 果 大 则 交换 ， 这 样 第 一 位 置 的 关键 字 在 一 次 循环 后 一 定 变 成 最 小 
值 。 如 图 9-3-2 所 示 ， 假 设 我 们 待 排序 的 关键 子 序 列 古 
{9,1,5,8,3,7,4,6,2}， 当 二 1 时 ，9 与 1 交换 后 ， 在 第 一 位 置 的 1 与 后 面 的 关 
键 字 比较 都 小 ， 因 此 它 就 是 最 小 值 。 当 i=2 时 ， 第 二 位 置 先 后 由 9 换 成 
Soy 换 成 2， 完 成 了 第 二 小 的 数字 交换 。 后 面 的 数字 变换 类 似 ， 

3 IT EA o 




















第 二 位 


最 终 将 ?放置 在 


UE ee 
= ay 
KX ass 
ip aS 
T Be 
aa ak 
I <45 


此 1 即 最 小 值 放置 在 站 位 


图 9-3-2 











它 应 该 算是 最 最 容易 写 出 的 排序 代码 了 ， 不 过 这 个 简单 易 懂 的 代码 ， 却 
征 有 缺陷 的 。 观 罕 后 发 现 ， 在 排序 好 1 和 2 的 位 置 后 ， 对 其 余天 键 字 的 排 
序 没 有 什么 帮助 〈 数 字 3 反 而 还 被 换 到 了 最 后 一 位 ) 。 也 就 是 说 ， 这 个 
算法 的 效率 是 非常 低 的 。 


9.3.2 冒 泡 排 序 算法 





我 们 来 看 看 正宗 的 冒 泡 算法 ， 有 没有 什么 改进 的 地 方 。 


/* 对 顺序 表 L 作 冒 泡 排序 */ 
void BubbleSort(SqList *L) 
{ 





a ee ale Ie 
fora = en 








/* 注意 j 是 从 后 往 前 循环 */ 
for (j = L->length - 1; j >= i;j--) 
if 



































/* 若 前 者 大 于 后 者 (注意 这 里 与 上 一 算法 差异 ) */ 
ashe (We [ale alee [la e aD) 





/* 交換 L- aes >r[]+1] 的 信 */ 
1); 


swap(L, J; 
+ 
+ 
} 
依然 假设 我 们 竺 排序 的 关键 字 序列 是 {9,1,5,8,3,7,4,6,2}， 当 i=1 时 ， 变 量 j 





由 8 反问 循环 到 1， 逐 个 比较 ， 将 较 小 值 交 换 到 前 面 ， 直 到 最 后 找到 最 小 
值 放 置 在 了 第 1 的 位 置 。 如 图 9-3-3 所 示 ， 当 i=1、j=8 时 ， 我 们 发 现 6>2， 
因此 交换 了 它们 的 位 置 ，j=7 时 ，4>2， 所 以 交换 ...... 直 到 j=2 时 ， 因 为 
1<2， 所 以 不 交换 。j=1 时 ，9>1， 交 换 ， 最 终 得 到 最 小 值 1 放 置 第 一 的 位 
置 。 事 实 上 ， 在 不 断 循环 的 过 程 中 ， 除了 将 关键 字 1 放 到 第 一 的 位 置 ， 

我 们 还 将 关键 字 2 从 第 九 位 置 提 到 了 第 三 的 位 置 ， 显 然 这 一 算法 比 前 面 
的 要 有 进步 ， 在 上 十 万 条 数据 的 排序 过 程 中 ， 这 种 差异 会 体现 出 来 。 图 














ioe 的 数 字 如 同 気 泡 般 慢 慢 浮 色 上 面 , AER REMANER 
ae 




















图 9-3-3 


当 i=2 时 ， 变 量 j 由 8 反 辐 循环 到 2， 逐 个 比较 ， 在 将 关键 字 2 交换 到 第 二 位 


置 的 同时 ， 也 将 关键 字 4 和 3 有 所 提升 。 





二 位 置 


当 i=2 时 将 次 小 什 2 骨 泡 到 第 


图 9-3-4 


后 面 的 数字 变换 很 简单 ， 这 里 就 不 在 详 述 了 。 


9.3.3 ‘AYER AL 





ROE BFE AE IA We? BREEN. WEP, WRR 
们 待 排序 的 序列 是 {2,1,3,4,5,6,7,8,9}， 也 就 是 说 ， 除 了 第 一 和 第 二 的 关 
键 字 需 要 交换 外 ， 别 的 都 已 经 是 正常 的 顺序 。 当 i=1 时 ， 交 换 了 2 和 1， 

此 时 序列 已 经 有 序 ， 但 是 算法 仍然 不 依 不 饶 地 将 i=2 到 9 以 及 每 个 循环 中 
的 循环 都 执行 了 一 遍 ， 尺 管 并 没有 交换 数据 ， 但 是 之 后 的 大 量 比 较 还 
是 大 大 地 多 余 了， 如 图 9-3-5 所 示 。 

















当 i=2 时 ， 由 于 没有 任何 数据 ”之 后 的 循环 判断 都 是 多 余 
交换 ， 就 说 明 此 序列 已 经 有 序 





图 9-3-5 
4i=2h, B4yeAwoss8, 847, ......5 3 与 2 作 了 比较 ， 没 有 任何 数 








据 交 换 ， 这 束 说 明 此 序列 已 经 有 序 ， 不 需要 再 继续 后 面 的 循环 判断 工作 
了 。 为 了 实现 这 个 想法 ， 我 们 需要 改进 一 下 代码 ， 增 加 一 个 标记 变量 
flag 来 实现 这 一 算法 的 改进 。 

















/* 对 顺序 表 L 作 改进 冒 泡 算法 */ 
void BubbleSort2(SqList *L) 
{ . . . 
atime: ay, Ie 
/* flag 用 来 作为 标记 */ 
Status flag = TRUE; 
/* 若 flag 为 true 说 明 有 过 数据 交换 ， 否 则 停止 循环 */ 
for (i = 1; i < L->length && flag; i++) 






































/* 初始 为 false */ 
flag = FALSE: 
fon (GES en git leslie ali 18) 


abe (eee) hig) a a |b tl) 
{ 


/* 交換 L- ees >r[j+1] 的 值 ey, 
SWAPIT, I ee 

/* w3 AMID. 则 flag 为 true 
flag = TRUE; 




















} 
J 
+ 











代码 改动 的 关键 就 是 在 ji 变量 的 for 循 环 中 ， 增 加 了 对 flag 是 否 为 true 的 判 
汤 。 经 过 这 样 的 改进 ， 冒 泡 排 序 在 性 能 上 就 有 了 一 些 提 升 ， 可 以 避免 因 
已 经 有 序 的 情况 下 的 无 意义 循环 判断 。 


9.3.4 BWH SARE oy er 











分 析 一 下 它 的 时 间 复 杂 上 度 。 当 最 好 的 情况 ， 也 就 是 要 排序 的 表 本 里 就 是 
有 序 的 ， 那 么 我 们 比较 次 数 ， 根 据 最 后 改进 的 代码 ， 可 以 推 呆 出 就 是 n- 
1 次 的 比较 ， 没 有 数据 交换 ， 时 间 复 杂 上 度 为 OOmD)。 当 最 坏 的 情况 ， 即 竺 
排序 表 是 逆序 的 情况 ， 此 时 需要 比较 sigma(i=2， n, i-1)=1+2+3+...+(n- 
TD)=n-1)/2 次 ， 并 作 等 数量 级 的 记录 移动 。 因 此 ， 总 的 时 间 复 杂 度 为 
O(n?)。 














9.4 简单 选择 排序 


爱 炒股 票 短线 的 人 ， 总 是 辟 欢 不 断 的 买 进 卖 出 ， 想 通过 价差 来 实现 般 
利 。 但 通常 这 之 种 频繁 操作 的 人 ， 即使 失误 不 多 ， 也 会 因为 操作 的 手续 费 
和 印花 税 过 高 而 获 利 很 少 。 还 有 一 种 做 股票 的 人 ， 他 们 很 少 出 手 ， 只 是 
在 不 断 的 观察 和 判断 ， 等 到 时 机 一 到 ， 果 断 买 进 或 卖 出 。 他 们 因为 冷 间 
和 沉着 ， 以 及 交易 的 次 数 少 ， 而 最 终 收 益 占 直 。 


冒 泡 排序 的 思想 就 是 不 断 地 在 交换 ， 通 过 交换 完成 最 终 的 排序 ， 这 和 做 
股票 短线 频繁 操作 的 人 是 类 似 的 。 我 们 可 不 可 以 像 兵 有 在 时 机 非常 明确 
到 来 时 才 出 手 的 股票 高 手 一 样 ， 也 就 是 在 排序 时 找到 合适 的 关键 字 再 做 
交换 ， 并 且 只 移动 一 次 就 完成 相应 关键 字 的 排序 定位 工作 呢 ? 这 惑 是 选 
择 排序 法 的 初步 思想 。 








选择 排序 的 基本 思想 是 每 一 越 在 n-i 十 1(=1,2,.…,n-1) 个 记录 中 选取 关键 字 
ANN OO 
Tike 


9.4.1 简单 选择 排序 算法 





简单 选择 排序 法 (Simple Selection Sort) 就 是 通过 n-i 次 关键 字 间 的 比 
较 ， 从 n-i 十 1 个 记录 中 选 出 关键 字 最 小 的 记录 ， 并 和 第 i (1sisn) 个 记 
KIZ. 


我 们 来 看 代码 。 


/* 对 顺序 表 L 作 简单 选择 排序 */ 
void SelectSort(SqList *L) 
{ 
Anta man: 
for (a = 1y 1 <TeS length IEE) 











/* 将 RSA FREA ETI */ 


mintes 








/* 循环 之 后 的 数据 */ 
ROS (Ges hele len 





/* 如 果 有 小 于 当前 最 小 值 的 关键 字 */ 
if (L->r[min] > L->r[j]) 

/” 将 此 关键 字 的 下 标 赋值 给 min */ 
min = j; 

















} 
/* 若 min 不 等 于 i， 说 明 找到 最 小 值 ， 交 换 */ 
if (ae l= min) 

/* 2#eL->r[i]SL->r[min] He */ 


swap(L, i, min); 


代码 应 该 说 不 难 理解 ， 针 对 竺 排序 的 关键 字 序 列 是 {9,15,8,3,7,4,6,2}， 
对 i 从 1 循环 到 8。 当 二 1 时 ，L.r[i]=9，min 开 始 是 1， 然 后 与 =2 到 9 比较 
L.r[min] 与 L.r 中 的 大 小 ， 因 为 j=2 时 最 小 ， 所 以 min=2。 最 终 交 换 了 L.r[2] 
与 L.r[1] 的 值 。 如 图 9-4-1 所 示 ， 注 意 ， 这 里 比较 了 8 次 ， 却 只 交换 数据 操 
f= 


TAR 7 8 9 


ーー 
=| min=2 


图 9-4-1 


当 i=2 时 ，L.r[i=9，min 开 始 是 2， 经 过 比较 后 ，min=9， 交 换 L.r[minj 与 
Li 的 值 。 如 图 9-4-2 所 示 ， 这 样 束 找到 了 第 二 位 置 的 关键 字 。 


ドド ーー 


に / min=9 
图 9-4-2 


当 i=3 时 ，L.r[ij=5，min 开 始 是 3， 经 过 比较 后 ，min=5， 交 换 L.r[min] 与 
Li 的 值 。 如 图 9-4-3 所 示 。 


Lae ーー 


に ) min=5 


图 9-4-3 











ee 最 多 经 过 8 次 交换 ， 束 可 完成 排 友 工 


9.4.2 ”简单 选择 排序 复杂 度 分 析 


从 人 简单 选择 排序 的 过 程 来 看 ， 它 最 大 的 特点 就 是 交换 移动 数据 次 数 相 当 
少 ， 这 样 也 就 节约 了 相应 的 时 间 。 分 析 它 的 时 间 复 杂 度 发 现 ， 无 论 最 好 
最 差 的 情况 ， 其 比较 次 数 都 是 一 样 的 多 ， 第 趟 排序 需要 进行 n-i 次 关键 
字 的 比较 ， 此 时 需要 比较 sigma(i=1，n-1，n-i)=(n-1)+(n-2)+...+1=n(n-1)/2 
次 。 而 对 于 交换 次 数 而 言 ， 当 最 好 的 时 候 ， 交 换 为 0 次 ， 最 差 的 时 候 ， 
也 就 初始 降序 时 ， 交 换 次 数 为 n-1 次 ， 基 于 最 终 的 排序 时 间 是 比较 与 交 
换 的 次 数 总 和 ， 因 此 ， 总 的 时 间 复 杂 度 依然 为 On?)。 





应 该 说 ， 尽 管 与 冒 泡 排序 同 为 O(n*)， 但 简单 选择 排序 的 性 能 上 还 是 要 
略 优 于 冒 泡 排 序 。 


9.5 直接 插入 排序 


扑 殉 牌 是 我 们 几乎 每 个 人 都 可 能 玩 过 的 游戏 。 最 基本 的 扑 殉 玩法 都 是 一 
边 摸 牧 ， 一 边 理 牌 。 假 如 我 们 拿 到 了 这 样 一 手 牌 ， 如 图 9-5-1 所 示 。 啊 ， 
似乎 是 同花顺 呀 ， 别 急 ， 我 们 得 理 一 理 顺序 才 知 道 是 否 是 真 的 同花顺 。 
请 问 ， 如 果 是 你 ， 应 该 如 何 理 脾 呢 ? 











图 9-5-1 


应 该 说 ， 哪 人 你 是 第 一 次 玩 扑 殉 牌 ， 只 要 认识 这 些 数 字 ， 理 牌 的 方法 都 
古 不 用 教 的 。 将 3 和 4 移动 到 5 的 左 侧 ， 再 将 2 移动 到 最 左 人 出， 顺序 就 算是 
理 好 了 。 这 里 ， 我 们 的 理 牌 方法 ， 束 是 直接 插入 排序 法 。 


9.5.1 直接 插入 排序 算法 


直接 插入 排序 (Straight Insertion Sort) 的 基本 操作 是 将 一 个 记录 插入 到 
己 经 排 好 序 的 有 序 表 中 ， 从 而 得 到 一 个 新 的 、 记 录 数 增 1 的 有 序 表 。 


顾名思义 ， 从 名 称 上 也 可 以 知道 它 是 一 种 插入 排序 的 方法 。 我 们 来 看 直 
接 插入 排序 法 的 代码 。 














/* 对 顺序 表 L 作 直接 插入 排序 */ 
void InsertSort(SqList *L) 
{ 
ine iy Jy 
fom (i S 2 E EEN eis) 


























/* 需 将 L->r[i] 插 入 有 序 子 表 */ 
if SE fay = Leer[ = 1) 
iL 











/* 疫 置 哨 兵 */ 

L->r[0] = L->r[i]; 

Tole (GG) Sale ake EEA > (Resell Sioa) 
/* ite */ 
LSS rie = E> rn [el 

/* 插入 到 正确 位 置 */ 

L->r[j + 1] = L->r[0]; 
































1. 程序 开始 运行 ， 此 时 我 们 传 入 的 SqList 人 参数 的 值 为 langth=6,r[6]= 
{0,5,3,4,6,2}， 其 中 r[0]=0 将 用 于 后 面 起 到 哨兵 的 作用 。 





2. 第 4 一 13 行 就 是 排序 的 主 循环 。i 从 2 开始 的 意思 是 我 们 假设 r[1]=5 已 
经 放 好 位 置 ， 后 面 的 牌 其 实 就 是 插入 到 它 的 左 侧 还 是 右 侧 的 问题 。 


作 。 第 8 行 ， 我 们 将 L.r[0] 赋 值 为 Lz]=3 的 目的 是 为 了 起 到 第 9~10 行 的 
循环 终止 的 判断 依据 。 如 图 9-5-2 所 示 。 图 中 下 方 的 虚线 箭头 ， 就 是 第 10 
行 ，Lzr[j+1H=L:rD] 的 过 程 ， 将 5 右 移 一 位 。 


PU 
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Laja 


图 9-5-2 





4. 此 时 ， 第 10 行 就 是 在 移动 完成 后 ， 空 出 了 空位 ， 然 后 第 11 行 
L.r[j+1]=L.r[0]， 将 哨兵 的 3 赋值 给 j=0 时 的 L.r[j+1]， 也 就 是 说 ， 将 扑克 有 牌 
3 放置 到 L.r[1] 的 位 置 ， 如 图 9-5-3 所 示 。 


LiL 
K i 








图 9-5-3 


5. 继续 循环 ， 第 6 行 ， 因 为 此 时 =3，L.r[i]=4 比 L.r[i-1]=5 要 小 ， 因 此 执 
行 第 8 一 11 行 的 操作 ， 将 5 再 右 移 一 位 ， 将 4 放置 到 当前 5 所 在 位 置 ， 如 图 
9-5-4 所 示 。 





图 9-5-4 


6. 再 次 循环 ， 此 时 i=4。 因 为 L.r[i=6 比 L.r[i-1]=5 要 大 ， 于 是 第 8 一 11 行 
代码 不 执行 ， 此 时 前 三 张 牌 的 位 置 没 有 变化 ， 如 图 9-5-5 所 示 。 


























图 9-5-5 
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7. 再 次 循环 ， 此 时 i=5， 因 为 L.r[i=2 比 L.r[i-1=6 要 小 ， 因 此 执行 第 8 一 
11 行 的 操作 。 由 于 6、5、4、3 都 比 2 小 ， 它 们 都 将 右 移 一 位 ， 将 2 放置 到 
当前 3 所 在 位 置 。 如 图 9-5-6 所 示 。 此 时 我 们 的 排序 也 就 完成 了 。 








` 
. - 
St...’ 


w ` 
Va 
Was weer Men’ 


图 9-5-6 


9.5.2 ”直接 插入 排序 复杂 度 分 析 





我 们 来 分 析 一 下 这 个 算法 ， 从 空间 上 来 看 ， 它 只 需要 一 个 记录 的 辅助 空 
间 ， 因 此 关键 是 看 它 的 时 间 复 杂 度 。 











当 最 好 的 情况 ， 也 就 是 要 排序 的 表 本 身 就 是 有 序 的 ， 比 如 纸牌 拿 到 后 就 
是 {2,3,4,5,6}， 那 么 我 们 比较 次 数 ， 其 实 束 是 代码 第 6 行 每 个 L.r[i 与 
L.r[i-1] 的 比较 ， 共 比较 了 (n-1)sigma(i=2,， n, JI 次， 由 于 每 次 都 是 








L.r[i]>L.r[fi-1]， 因 此 没有 移动 的 记录 ， 时 间 复 杂 度 为 O(n)。 


当 最 坏 的 情况 ， 即 竺 排序 表 是 逆序 的 情况 ， 比 如 {6,5,4,3,2}， 此 时 需要 
比较 sigma(i=2，n，iD=2+3+...+n=(n+2)(n-1)/2 次 ， 而 记录 的 移动 次 数 也 达 
到 最 大 值 sigma(i=2, n, i+1)=(n+4)(n-1)/2 次 。 














如 果 排 序 记录 是 随机 的 ， 那 么 根据 概率 相同 的 原则 ， 平 均 比 较 和 移动 次 
数 约 为 n%/4 次 。 因 此 ， 我 们 得 出 直接 插入 排序 法 的 时 间 复 杂 度 为 O(n”)。 

从 这 里 也 看 出 ， 同 样 的 O(n”) 时 间 复 杂 度 ， 直 接 插入 排序 法 比 冒 泡 和 简 

单 选择 排序 的 性 能 要 好 一 些 。 





9.6 ”和希 尔 排序 
给 大 家 出 一 道 智 力 题 。 请 问 “VII 是 什么 ? 


咽 ， 很 好 ， 它 是 罗马 数字 的 7。 现 在 我 们 要 给 它 加 上 一 笔 ， 让 它 变 成 
8 CVII) ， 应 该 是 非常 简单 ， 只 需要 在 右 侧 加 一 坚 线 即 可 。 


现在 我 请 大 家 试 着 对 罗马 数字 9， 也 就 是 “IX” 增 加 一 笔 ， 把 它 变 成 6， 应 
BBARR? OLa ea ) 





我 已 经 听 不 少 声音 说 , “这 怎么 可 能 ! ”可 为 什么 一 定 要 用 常规 方法 呢 ? 


我 这 里 有 3 种 妨 类 的 方法 可 以 实现 它 。 


方 法 一 : 濁 察 友 現 “X” 其 突 可 以 看 作 下 一 休 正 放 一 人 倒置 世 條 “V”。 
此 我 们 ， 给 “IX” 中 间 加 一 条 水 平 线 ， 上 下 颠倒 ， 然 后 遮 住 下 面部 分 ， 也 
了 台 是 说 ， 我 们 所 谓 的 加 上 一 笔 惑 是 遮 住 一 部 分 ， 于 是 就 得 到 “VIP ， 如 图 
9-6-1 所 示 。 





图 9-6-1 





方法 二 : 在 “IX” 前 面 加 一 个 “S”， 此 时 构成 一 个 英文 单词 “SIX”， 这 就 等 
于 得 到 一 个 6 了 。 哈 哈 ， 我 听 到 下 面 一 片 哗然 ， 我 刚 有 没有 说 一 定 要 
是 “VE 呀 ， 我 只 说 把 它 变 成 6 而 已 ， 至 于 是 罗马 数字 还 是 英文 单词 ， 我 
可 没有 限制 。 显 然 ， 你 们 的 思维 受到 了 我 前 面 举 例 的 “VIT 转 变 

为 “VIHT 的 影响 ， 如 图 9-6-2 所 示 。 


X> SIX 


图 9-6-2 











方法 三 ， 在 “IX” 后 面 加 一 个 “6”， 得 到 “1X6”， 其 结果 当然 是 数字 6 了 ，。 
大 家 笑 了 ， 因 为 这 个 想法 实在 是 过 分 ， 把 字母 <P 当 成 了 数字 1， 字 
母 “X" 看 成 了 乘 号 。 可 谁 又 规定 说 这 是 不 可 以 的 呢 ? 只 要 没 违反 规则 ， 
得 到 6 即 可 ， 如 图 9-6-3 所 示 。 


A> IXO 








图 9-6-3 


智力 题 的 管 案 介绍 完了 。 大 家 会 发 现 ， 看 似 解决 个 了 的 问题 ， 还 真 不 一 
定 束 没有 办 法 ， 也 许 只 是 暂时 没 想 到 去 了 。 





我 们 都 能 理解 ， 优 秀 排序 算法 的 首要 条 件 就 是 速度 。 于 是 人 们 想 了 许 许 
多 多 的 办 法 ， 目 的 就 是 为 了 提高 排序 的 速度 。 而 在 很 长 的 时 间 里 ， 众 人 
发 现 尽管 各 种 排序 算法 花样 繁多 《〈 比 如 前 面 我 们 提 到 的 三 种 不 同 的 排序 
算法 ) ， 但 时 间 复 杂 度 都 是 O(n”)， 似 乎 没 法 超越 了 。 此 时 ， 计 算 机 学 
术 界 充斥 着 “排序 算法 不 可 能 突破 O(n?)* 的 声音 。 就 像 刚 才 大 家 做 智力 题 
的 感觉 一 样 , “不 可 能 ?成 了 主流 。 














终于 有 一 天 ， 当 一 位 科学 家 发 布 超越 了 O(n”) 新 排序 算法 后 ， 紧 接着 就 
出 现 了 好 几 种 可 以 超越 O(n) 的 排序 算法 ， 并 把 内 排序 算法 的 时 间 复 杂 
度 提 升 到 了 O(nlogn)。“ 不 可 能 超越 O(n*)” 彻 底 成 为 了 历史 。 





从 这 里 也 告诉 我 们 ， 做 任何 事 ， 你 解决 不 了 时 ， 想 一 想 “Nothing is 
impossible!”*， 昌 然 有 点 唯心 ， 但 这 样 的 思维 方式 会 让 你 更 加 深入 地 思考 
解决 方案 ， 而 不 是 匆忙 的 放弃 。 


9.6.1 而 尔 排序 原理 


现在 ， 我 要 讲解 的 算法 叫 希 尔 排序 (ShellSort) 。 希 尔 排序 是 D.L.Shell 
UL 在 这 之 前 排序 算法 的 时 间 复 杂 度 基本 
* 是 Om 





2) 的 ， 和 希 尔 排 序 算 法 是 突破 这 个 时 间 复 杂 度 的 第 一 批 算法 之 一 。 





我 们 前 一 节 讲 的 直接 插入 排序 ， 应 该 说 ， 它 的 效率 在 菜 些 时 候 是 很 高 
的 ， 比 如 ， 我 们 的 记录 本 刁 就 是 基本 有 序 的， 我 们 只 需要 少量 的 插入 操 
作 ， 就 可 以 完成 整个 记录 集 的 排序 工作 ， 此 时 直接 插入 很 高 效 。 还 有 就 








征 记录 数 比 较 少 时 ， 直 接 插入 的 优势 也 比较 明显 。 可 问题 在 于 ， 两 个 条 
件 本 丑 就 过 于 苛刻 ， 现 实 中 记录 少 或 者 基本 有 序 都 属于 特殊 情况 。 








不 过 别 急 ， 有 条 件 当 然 是 好 ， 条 件 不 存在 ， 我 们 创造 条 件 也 是 可 以 去 做 
的 ， 于 大 科学 家 希 尔 研究 出 了 一 种 排序 方法 ， 对 直接 插入 排序 改进 后 可 
以 增加 效率 。 














如 何 让 待 排序 的 记录 个 数 较 少 呢 ? 很 容易 想到 的 就 是 将 原本 有 大 量 记录 
数 的 记录 进行 分 组 。 分 割 成 若干 个 子 序列 ， 此 时 每 个 子 序列 待 排序 的 记 
录 个 数 就 比较 少 了 ， 然 后 在 这 些 子 序列 内 分 别 进行 直接 插入 排序 ， 当 束 
个 序列 都 基本 有 序 时 ， 注 意 只 是 基本 有 序 时 ， 再 对 全 体 记录 进行 一 次 直 
接 插入 排序 。 











此 时 一 定 有 同学 开始 疑惑 了 。 这 不 对 呀 ， 比 如 我 们 现在 有 序列 是 
{9,1,5,8,3,7,4,6,2}， 现 在 将 它 分 成 三 组 ，{9,1,5}，{8,3,7}，{4,6,2}， 哪 
怕 将 它们 各 自 排序 排 好 了 ， 变 成 {1,5,9}，{3,7,8}，{2,4,6}， 再 合并 它们 
成 {1,5,9,3,7,8,2,4,6}， 此 时 ， 这 个 序列 还 是 杂乱 无 序 ， 谈 不 上 基本 有 
序 ， 要 排序 还 是 重 来 一 遍 直接 插入 有 序 ， 这 样 做 有 用 吗 ? 需要 强调 一 
下 ， 所 谓 的 基本 有 序 ， 就 是 小 的 关键 字 基 本 在 前 面 ， 大 的 基本 在 后 面 ， 
不 大 不 小 的 基本 在 中 间 ， 像 12,13,6,4,7,5,8,9} 这 样 可 以 称 为 基本 有 序 
了 。 但 像 {1,5,9,3,7,8,2,4,6} 这 样 的 9 在 第 三 位 ，2 在 倒数 第 三 位 就 谈 不 上 
基本 有 序 。 




















问题 其 实 也 就 在 这 里 ， 我 们 分 割 竺 排序 记录 的 目的 是 减少 竺 排序 记录 的 
个 数 ， 并 使 整个 序列 癌 基本 有 序 发 展 。 而 如 上 面 这 样 分 完 组 后 就 各 目 排 
序 的 方法 达 不 到 我 们 的 要 求 。 因 此 ， 我 们 需要 采取 跳跃 分 割 的 策略 : 将 
相距 茶 个 “ 增 量 ?的 记录 组 成 一 个 子 序列 ， 这 样 才 能 保证 在 子 序列 内 分 别 
进行 直接 插入 排序 后 得 到 的 结果 是 基本 有 序 而 不 是 局 部 有 序 。 

















9.6.2 ”布尔 排序 算法 





好 了 ， 为 了 能 够 真正 弄 明 白 希 尔 排序 的 算法 ， 我 们 还 是 老 办 法 一 一 模拟 
计算 机 在 执行 算法 时 的 步骤 ， 还 研究 算法 到 底 是 如 何 进行 排序 的 。 





希 尔 排序 算法 代码 如 下 。 


/* 对 顺序 表 L 作 希 尔 排 序 */ 
void ShellSort(SqList *L) 
































{ 
inte 0 
int increment = L->length; 
do 
{ | 
/* 増量 序列 */ 
increment = increment / 3 + 1; 
for (i = increment + 1; i <= L->length; i++) 
if (L->r[i] < L->r[i - increment]) 
/* 需 将 L->r[i] 插 入 有 序 增 量子 表 */ 
/* 暂 存在 L->r[9] */ 
L->r[9] = L->r[i]; 
for (j = i - increment; j > © & 
L->r[0] < L->r[j]; j -= increment) 
/* 记录 后 移 ， 查 找 插入 位 置 */ 
L->r[j + increment] = L->r[j]; 
/* 捕 入 */ 
L->r[j + increment] = L->r[0]; 
+ 
is 
while (increment > 1); 
} 


1. 程序 开始 运行 ， 此 时 我 们 传 入 的 SqList 参 数 的 值 为 langth=9,r[10]= 
{0,9,15,8,3,7,4,6,2}。 这 吏 是 我 们 需要 等 竺 排序 的 序列 ， 如 图 9-6-4 所 


90909000 











图 9-6-4 


2. 第 4 行 ， 变 量 increment 束 是 那个 “ 增 量 "”， 我 们 初始 值 让 它 等 于 待 排序 
的 记录 数 。 


3. 第 5 一 19 行 是 一 个 do 循环 ， 它 提 终 止 条 件 是 increment 不 大 于 1 时 ， 其 
实 也 就 是 增 量 为 1 时 就 停止 循环 了 。 








4. 第 7 行 ， 这 一 句 很 关键 ， 但 也 是 难以 理解 的 地 方 ， 我 们 后 面 还 要 谈 到 
它 ， 先 放 一 放 。 这 里 执行 完成 后 ，increment=9/3+1=4。 


5. 第 8 一 17 行 是 一 个 for 循 环 ，i 从 4+1=5 开 始 到 9 结束 。 


6. 第 10 行 , 鹿 断 L.r[il 与 L.riincre-ment] 大 小 , L.r[5 モ 3 小 干 Lrli-incre- 
ment]=L.r[1]=9, 満足 条件 , 第 12 行 , 格 L.rl5]=3 暫 存 入 L.r[0]。 第 13 一 14 
行 的 循环 只 是 为 了 将 L.r[1]=9 的 值 赋 给 L.r[5]， 由 于 循环 的 增 量 是 j- 
=increment， 其 实 它 就 循环 了 一 次 ， 此 时 j=-3。 第 15 行 ， 再 将 L.r[0]=3 赋 
值 给 L.r[j+incre-ment]=L.r[-3+4]=L.r[1]=3。 如 图 9-6-5 所 示 ， 事 实 上 ， 这 
一 段 代 码 束 干 了 一 件 事 ， 就 是 将 第 5 位 的 3 和 第 1 位 的 9 交换 了 位 置 。 


下 标 0 123 45678 9 
JMBHBMEEE 
increment=4 1953 交换 一 


图 9-6-5 


7. 循环 继续 ，i=6，L.r[6]=7>L.r[i-incre-mentl=L.r[2]=1， 因 此 不 交换 两 
者 数据 。 如 图 9-6-6 所 示 。 


eo 123456789 
国 引 374 人 

increment=4 し 1]. AHH 

図 9-6-6 


8. 循环 继续 ，i=7，L.r[7]=4<L.r[i-incre-ment]=L.r[3]=5， 交 换 两 者 数 
据 。 如 图 9-6-7 所 示 。 


increment= t syy, 交换 一 人 


图 9-6-7 


9. 循环 继续 ，i=8，L.r[8]=6<L.r[i-incre-mentlj=L.r[4]=8， 交 换 两 者 数 
据 。 如 图 9-6-8 所 示 。 


下 标 00 1 2 3 4567 8 9 





increment=4 ton 交换 一 


图 9-6-8 


10. 循环 继续 ，i=9，L.r[9]=2<L.r[i-incre-ment]=L.r[5]=9， 交 换 两 者 数 
据 。 注 意 ， 第 13~~14 行 是 循环 ， 此 时 还 要 继续 比较 L.r[5] 与 Lr[1] 的 大 
小 ， 因 为 2<3， 所 以 还 要 交换 L.r[5] 与 L.r[1] 的 数据 ， 如 图 9-6-9 所 示 。 





fk 0 1 2 3 45 6789 

HEEMMHHB 

increment=4 t 959, 交换 一 
し?2, 交换 一 人 


图 9-6-9 


最 终 第 一 轮 循环 后 ， 数 组 的 排序 结果 为 图 9-6-10 所 示 。 细 心 的 同学 会 发 
现 ， 我 们 的 数字 1、2 等 小 数字 已 经 在 前 两 位 ， 而 8、9 等 大 数字 已 经 在 后 
两 位 ， 也 就 是 说 ， 通 过 这 样 的 排序 ， 我 们 已 经 让 整个 序列 基本 有 序 了 。 
这 其 实 就 是 希 尔 排序 的 精华 所 在 ， 它 将 关键 字 较 小 的 记录 ， 不 是 一 步 一 
步 地 往 前 挪动 ， 而 是 跳跃 式 地 往 前 移 ， 从 而 使 得 每 次 完成 一 轮 循环 后 ， 
整个 序列 就 朝 着 有 序 坚实 地 迈进 一 步 。 























Me 0 1 2 3 4 5 6 7 8 9 





11. 我 们 继续 ， 在 完成 一 轮 do 循 环 后 ， 此 时 由 于 increment=4>1 因 此 我 们 
需要 继续 do 循环 。 第 7 行 得 到 increment=4/3+1=2。 第 8 一 17 行 for 循 环 ，i 
从 2+1=3 开 始 到 9 结束 。 当 i=3、4 时 ， 不 用 交换 ， 当 i=5 时 ， 需 要 交换 数 
据 ， 如 图 9-6-11 所 示 。 


人 0 1 2 3 4 56 7 8 9 
IBMEHBMBEE 
increment=2 :2<4， 不 交换 
1<6， 不 交换 
£53, 交换 4 


图 9-6-11 


12. 此 后 ，i=6、7、8、9 均 不 用 交换 ， 如 图 9-6-12 所 示 。 


Pi 0 1 2 3 4 5 6 7 8 9 





increment=2 L Paar 
4S, MEA 
18, Kili 
59, RH 


图 9-6-12 


13. 再 次 完成 一 轮 do 循 环 ，increment=2>1， 再 次 do 循环 ， 第 7 行 得 到 
incre-ment=2/3+1=1， 此 时 这 就 是 最 后 一 轮 do 循 环 了 。 尺 管 第 8 一 17 行 for 
循环 ，i 从 ”1+1=2 开 始 到 9 结束 ， 但 由 于 当前 序列 已 经 基本 有 序 ， 可 交换 
数据 的 情况 大 为 减少 ， 效 率 其 实 很 高 。 如 图 9-6-13 所 示 ， 图 中 箭头 连 线 
为 需要 交换 的 关键 字 。 





4 ) 6 / 


increment= 
时 1 1 
E= 


图 9-6-13 





最 终 完成 排序 过 程 ， 如 图 9-6-14 所 示 。 


hp 4 ) 6 7 


图 9-6-14 


9.6.3 布尔 排序 复杂 度 分 析 





通过 这 段 代 码 的 列 析 ， 相 信 大 家 有 些 明 白 ， 希 尔 排序 的 关键 并 不 是 随便 





分 组 后 各 目 排序 ， 而 是 将 相 隅 茶 个 “ 撒 量 ?的 记录 组 成 一 个 子 序 列 ， 实 现 
跳跃 式 的 移动 ， 使 得 排序 的 效率 所 高 。 


这 里 “ 增 量 ” 的 选取 就 非常 关键 了 。 我 们 在 代码 中 第 7 行 ， 是 用 
increment=increment/3+1; 的 方式 选取 增 量 的 ， 可 究竟 应 该 选取 什么 样 的 
增 量 才 是 最 好 ， 目 前 还 是 一 个 数学 难题 ， 迄 今 为 止 还 没有 人 找到 一 种 最 
好 的 增 量 序列 。 不 过 大 量 的 研究 表明 ， 当 增 量 序列 为 dlta[k]=2t-k+1- 

1 (0sksts) 时 ， 可 以 获得 不 错 的 效率 ， 其 时 间 复 杂 度 为 OOn3/2)， 要 好 
于 直接 排序 的 O(n”)。 需 要 注意 的 是 ， 增 量 序 列 的 最 后 一 个 增 量 值 必须 
等 于 1 才 行 。 男 外 由 于 记录 是 跳跃 式 的 移动 ， 希 尔 排 序 并 不 是 一 种 稳定 
的 排序 算法 。 




















不 定 怎 么 说 ， 希 尔 排序 算法 的 及 明 ， 使 得 我 们 终于 突破 了 慢 速 排序 的 时 
代 《〈 超 越 了 时 间 复 杂 度 为 Oo9) ， 之 后 ， 相 应 的 更 为 高 效 的 排序 算法 
也 就 相继 出 现 了 。 





9.7 HEHE? 


我 们 前 面 讲 到 简单 选择 排序 ， 它 在 待 排序 的 n 个 记录 中 选择 一 个 最 小 的 
记录 需要 比较 n-1 次 。 本 来 这 也 可 以 理解 ， 碍 找 第 一 个 数据 需要 比较 这 
么 多 次 是 正常 的 ， 否 则 如 何 知道 它 是 最 小 的 记录 。 





可 惜 的 是 ， 这 样 的 操作 并 没有 把 每 一 趟 的 比较 结果 保存 下 来 ， 在 后 一 趟 
的 比较 中 ， 有 许多 比较 在 前 一 趟 已 经 做 过 了 ， 但 由 于 前 一 趟 排序 时 未 保 
存 这 些 比较 结果 ， 所 以 后 一 趟 排序 时 又 重复 执行 了 这 些 比较 操作 ， 因 和 而 
记录 的 比较 次 数 较 多 。 














如 果 可 以 做 到 每 次 在 选择 到 最 小 记录 的 同时 ， 并 根据 比较 结果 对 其 他 记 
录 做 出 相应 的 调整 ， 那 样 排 序 的 总 体 效 率 就 会 非常 高 了 。 而 堆 排 序 
(HeapSort) ， 就 是 对 简单 选择 排序 进行 的 一 种 改进 ， 这 种 改进 的 效果 
是 非常 明显 的 。 堆 排序 算法 是 Floyd 和 Williams 在 1964 年 共同 发 明 的 ， 同 
时 ， 他 们 发 明了 “ 堆 ” 这 样 的 数据 结构 。 








图 9-7-1 





回忆 一 下 我 们 小 时 候 ， 特 别 是 男 同学 ， 基 本 都 玩 过 痘 罗 汉 的 恶作剧 。 通 
常 都 是 先 把 某 个 要 整 的 人 按 倒 在 地 ， 然 后 大 家 就 一 拥 而 上 扑 了 上 去 .…… 
后 果 ? 后 果 当 然 就 是 一 笑 了 之 ， 一 个 恶作剧 而 已 。 不 过 在 西班牙 的 加 素 
罗 尼 亚 地 区 ， 他 们 将 镭 罗 汉 视 为 了 正 儿 八 经 的 民族 体育 活动 ， 如 图 9-7-1 
所 示 ， 可 以 想象 当时 场面 的 壮观 。 


登 罗 汉 运 动 是 把 人 堆 在 一 起 ， 而 我 们 这 里 要 介绍 的 “ 堆 ” 结 构 相 当 于 把 数 
字符 写 堆 成 一 个 塔 型 的 结构 。 当 然 ， 这 绝 不 是 简单 的 堆砌 。 大 家 看 图 9- 
7-2 所 示 ， 能 够 找到 什么 规律 吗 ? 
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图 9-7-2 


很 明显 ， 我 们 可 以 发 现 它 们 都 是 二 又 树 ， 如 有 果 观 察 仔 细 些 ， 还 能 看 出 它 
们 都 是 完全 二 又 树 。 左 图 中 根 结 点 是 所 有 元 素 中 最 大 的 ， 右 图 的 根 绩 点 
是 所 有 元 系 中 最 小 的 。 再 细 看 看 ， 发 现 左 图 每 个 结 点 都 比 它 的 左右 孩子 

















要 大 ， 右 图 每 个 结 点 都 比 它 的 左右 孩子 要 小 。 这 就 是 我 们 要 讲 的 堆 结 
构 。 


堆 是 具有 下 列 性 质 的 完全 二 又 树 : 每 个 结 反 的 值 都 大 于 或 等 于 其 左右 孩 
子 结 点 的 值 ， 称 为 大 顶 堆 例如 图 9-7-2 左 图 所 示 〉; 或 者 每 个 结 点 的 值 
都 小 于 或 等 于 其 左右 孩子 结 反 的 值 ， 称 为 小 项 堆 〈 例 如 图 9-7-2 石 图 所 
示 ) 。 





这 里 需要 注意 从 堆 的 定义 可 知 ， 根 结 点 一 定 是 堆 中 所 有 结 点 最 大 小) 
者 。 较 大 (小 ) 的 结 点 靠近 根 结 点 (但 也 不 绝对 ， 比 如 右 图 小 顶 堆 中 
60、40 均 小 于 70， 但 它们 并 没有 70 靠 近 根 结 点 ) 。 








如 果 按 照 层 序 遍历 的 方式 给 结 点 从 1 开始 编号 ， 则 结 点 之 间 满 足 如 下 关 


PANE 





这 里 为 什么 要 小 于 等 于 呢 ? MARR EAB AS S NAWE, 其 
实 瓦 记 也 不 奇怪 ， 这 个 性 质 在 我 们 讲 完 之 后 ， 就 再 也 没有 提 到 过 它 。 可 
以 说 ， 这 个 性 质 仿佛 融 是 在 为 堆 准 备 的 。 性 质 5 的 第 一 条 惑 说 一 株 完 全 
二 义 树 ， 如 果 二 1， 则 结 皮 i 是 二 又 树 的 根 ， 无 双亲 ; 如 果 i>1， 则 其 双亲 
是 结 点 。 那 么 对 于 有 n 个 结 反 的 二 文 树 而 言 ， 它 的 1 值 自然 就 是 小 于 等 于 
了 。 性 质 5 的 第 和 二、 三 条 ， 也 是 在 说 明 下 标 i 与 2 和 2i+1 的 双亲 子女 关 
系 。 如 果 完 全 态 记 的 同学 不 妨 去 复习 一 下 。 


Co ea We FEA, Wee LE 
的 关系 表达 ， 如 图 9-7-3 所 示 
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图 9-7-3 


我 们 现在 讲 这 个 堆 结 构 ， 其 目的 就 是 为 了 堆 排 序 用 的 。 


9.7.1 推 排 序 算法 


堆 排 序 (Heap Sort) WNAE (假设 利用 大 项 堆 〉 进行 排序 的 方法 。 
它 的 基本 思想 是 ， 将 竺 排序 的 序列 构造 成 一 个 大 顶 堆 。 此 时 ， 整 个 序列 
的 最 大 值 就 是 堆 项 的 根 结 点 。 将 它 移 走 〈 其 实 就 是 将 其 与 扒 数 组 的 末尾 
元 素 交 换 ， 此 时 末尾 元 系 束 是 最 大 值 〉， 然 后 将 剩余 的 n-1 个 序列 重新 
构造 成 一 个 堆 ， 这 样 束 会 得 到 n 个 元 素 中 的 次 大 值 。 如 此 反复 执行 ， 便 
能 得 到 一 个 有 序 序列 了 。 

















例如 图 9-7-4 所 示 ， 图 册 是 一 个 大 顶 堆 ，90 为 最 大 值 ， 将 90 与 20 (末尾 元 
素 ) 互 换 ， 如 图 凶 所 示 ， 此 时 90 就 成 了 整个 堆 序列 的 最 后 一 个 元 素 ， 将 
20 经 过 调整 ， 使 得 除 90 以 外 的 结 点 继续 满足 大 项 扒 定 义 〈 所 有 结 点 都 大 
于 等 于 其 子 孩子 ) ， 见 图 @)， 然 后 再 考虑 将 30 与 80 互 换 .….…… 

















图 9-7-4 








相信 大 家 有 些 明白 扒 排 序 的 基本 思想 了 ， 不 过 要 实现 它 还 需要 解决 两 个 
问题 :1 如何 由 一 个 无 序 序 列 构建 成 一 个 堆 ? 2. 如 果 在 输出 堆 顶 元 素 
后 ， 调 整 剩余 元 素 成 为 一 个 新 的 堆 ? 





要 解释 清楚 它们 ， 让 我 们 来 看 代码 。 











/* 对 顺序 表 L 进 行 堆 排序 */ 
void HeapSort(SqList *L) 
{ 





ame abe 

/* 把 L 中 的 r 构 建成 一 个 大 项 堆 */ 

for (i = L->length / 2; i > 0; i--) 
HeapAdjust(L, i, L->Length); 

Ole, (tre. > eng th; ake al abo) 




















/* 将 堆 顶 记录 和 当前 未 经 排序 子 序列 的 最 后 一 个 记录 交换 */ 
swap(L, 1, i); 
/* 将 L->r[1. .i-1] 重 新 调整 为 大 顶 堆 */ 
HeapAdjust(L, 1, 1 - 1); 

} 




















} 


从 代码 中 也 可 以 看 出 ， 整 个 排序 过 程 分 为 两 个 for 循 环 。 第 一 个 循环 要 完 
成 的 就 是 将 现在 的 竺 排序 序列 构建 成 一 个 大 顶 推 。 第 二 个 循环 要 完成 的 
GT A 并 且 再 调整 其 成 为 大 
MHE. 














假设 我 们 要 排序 的 序列 是 {50,10,90,30,70,40,80,60,20}， 那 么 

L.length=9， 第 一 个 for 循 环 ， 代 码 第 4 行 ，i 是 从 =4 开 始 ，4 一 3 一 2 一 1 的 

变量 变化 。 为 什么 不 是 从 1 到 9 或 者 从 9 到 1， 而 是 从 4 到 1 呢 ? 其 实 我 们 看 
了 图 9-7-5 就 明白 了 ， 它 们 都 有 什么 规律 ? 它们 都 是 有 孩子 的 结 点 。 注 意 
灰色 结 点 的 下 标 编 号 就 是 1、2、3、4。 











0 ) 


图 9-7-5 





我 们 所 谓 的 将 竺 排序 的 序列 构建 成 为 一 个 大 顶 堆 ， 其 实 就 是 从 下 往 上 、 
从 右 到 左 ， 将 每 个 非 终端 结 点 〈 非 叶 结 点 ) 当 作 根 结 点 ， 将 其 和 其 子 树 
週 整 成 大 項 堆 。 的 4 っ 3 っ 2 っ 1 的 変量 変化 , 其 突 也 就 赴 30, 90, 10、 





50 的 结 上 调整 过 程 。 


既然 已 经 弄 清楚 的 变化 是 在 调整 哪些 元 素 了 ， 
HeapAdjust《〈 扒 调整 ) 函数 是 如 何 实现 的 。 
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Vix 


Ves 








己 知 L->r[s. .m] 中 记录 的 关键 字 除 L->r[s] 之 外 
均 满 足 堆 的 定义 */ 

使 L->r[s..m] 成 
为 一 个 大 项 堆 























void ee il Sn) 


int temp, j; 

temp = L->r[s]; 

Ja 沿 关键 字 较 大 的 孩子 结 点 向 下 筛选 */ 
O(n 2 





alae (Cp su ise Ee cE ne abl} 
/* j 为 关键 字 中 较 大 的 记录 的 下 标 */ 
++j; 
if (temp >= L->r[j]) 
/* rc 应 插入 在 位 置 Ss 上 */ 
break: 
L->r[s] = L->r[j]; 
EN 
} 
/* 搬入 */ 
L->r[s] = temp; 














现在 我 们 来 看 关键 的 


函数 被 第 一 次 调用 时 ，s=4，m=9， 传 入 的 SqList 参 数 的 值 为 


length=9,r[10]={0,50, 10,90,30,70,40,80,60,20}. 


2. 第 4 行 ， 将 L.r[s]=L.r[4]=30 赋 值 给 temp， 如 图 9-7-6 所 示 。 
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图 9-7-6 








呢 ? 又 为 什么 是 广 2 递 增 呢 ? JE BE — SORTA HENS, ALA RAT RE 
完全 二 又 树 ， 当 前 结 点 序号 是 s， 其 左 孩 子 的 序号 一 定 是 23， 右 孩子 的 
序号 一 定 是 2s+1， 它 们 的 孩子 当然 也 是 以 2 的 位 数 序号 增加 ， 因 此 j 变 量 
才 是 这 样 循环 。 








4. 第 7 一 8 行 ， 此 时 j=2*4=8，j<m 说 明 它 不 是 最 后 一 个 结 点 ， 如 果 L.r[j] 
<Lr[j+1， 则 说 明 左 孩子 小 于 右 孩 子 。 我 们 的 目的 是 要 找到 较 大 值 ， 当 
然 需 要 让 j+1 以 便 变 成 指向 右 孩 子 的 下 标 。 当 前 30 的 左右 孩子 是 60 和 
20， 并 不 满足 此 条 件 ， 因 此 j 还 是 8。 


5. 第 9 一 10 行 , temp=30, L.r[j]=60, 井 不 満足 条件 。 


6. 第 11 一 12 行 ， 将 60 赋 值 给 L.r[4]， 并 令 s=j=8。 也 就 是 说 ， 当 前 算出 ， 
以 30 为 根 结 点 的 子 二 叉 树 ， 当 前 最 大 值 是 60， 在 第 8 的 位 置 。 注 意 此 时 
Lr[4] 和 L.r[8] 的 值 均 为 60。 


7. 再 循环 因为 j=2*j=16，m=9，j>m， 因 此 跳出 循环 。 


8. 第 14 行 ， 将 temp=30 赋 值 给 L.r[s]=L.r[8]， 完 成 30 与 60 的 交换 工作 。 
如 图 9-7-7 所 示 。 本 次 函数 调用 完成 。 
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图 9-7-7 


9. 再 次 调用 HeapAdjust， 此 时 S=3，m=9。 第 4 行 ，temp=L.r[3]=90， 第 7 
一 8 行 ， 由 于 40<80 得 到 j+1=2*s+1=7。9 一 10 行 ， 由 于 90>80， 因 此 退出 
循环 ， 最 终 本 次 调用 ， 整 个 序列 未 发 什么 改变 。10. 再 次 调用 
HeapAdjust， 此 时 s=2，m=9。 第 4 行 ，temp=L.r[2]=10， 第 7 一 8 行 ， 
60<70， 使 得 j=5。 最 终 本 次 调用 使 得 10 与 70 进 行 了 互 换 ， 如 图 9-7-8 所 
ZN o 
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图 9-7-8 


11. 再 次 调用 HeapAdjust， 此 时 s=1，m=9。 第 4 行 ，temp=L.r[1]=50， 第 
7~8{T, 70<90, 使 得 j」=3。 第 11 一 12 行 , Lirl1 eA 90, Jf As=3, 

再 循环 ， 由 于 2j=6 并 未 大 于 m， 因 此 再 次 执行 循环 体 ， 使 得 L.r[3] 被 赋值 
了 80， 完 成 循环 后 ，L.[7] 被 赋值 为 50， 最 终 本 次 调用 使 得 50、90、80 进 
行 了 轮换 ， 如 图 9-7-9 所 示 。 
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图 9-7-9 


到 此 为 止 ， 我 们 构建 大 顶 扒 的 过 程 算是 完成 了 ， 也 束 是 HeapSort 函 数 的 
第 4 一 5 行 循环 执行 完毕 。 或 许 是 有 点 复杂 ， 如 果 不 明 白 ， 多 试 着 模拟 计 
算 机 执行 的 方式 走 几 裔 ， 应 该 束 可 以 理解 其 原理 。 








接 下 来 HeapSort 函 数 的 第 6 一 11 行 就 是 正式 的 排序 过 程 ， 由 于 有 了 前 面 
的 充分 准备 ， 其 实 这 个 排序 就 比较 轻松 了 。 下 面 是 这 部 分 代码 。 


for (i = L->length; i > 1; i--) 


/* 将 堆 顶 记录 和 当前 未 经 排序 子 序列 的 最 后 一 个 记录 交换 */ 
swap(L, 1,1); 
/* 将 L->r[1. .i-1] 重 新 调整 为 大 顶 堆 */ 
HeapAdjust(L,1,1i-1); 

















1. 当 i=9 时 ， 第 8 行 ， 交 换 20 与 90， 第 9 行 ， 将 当前 的 根 结 点 20 进 行 大 项 
堆 的 调整 ， 调 整 过 程 和 刚才 流程 一 样 ， 找 到 它 左 右 子 结 点 的 较 大 值 ， 互 
换 ， 再 找到 其 子 结 点 的 较 大 值 互 换 。 此 时 序列 变 为 
{80,70,50,60,10,40,20,30,90}， 如 图 9-7-10 所 示 。 








图 9-7-10 


2. 当 i=8 时 ， 交 换 30 与 80， 并 将 30 与 70 交 换 ， 再 与 60 交 换 ， 此 时 序列 变 
为 {70,60,50,30,10,40,20,80,90}， 如 图 9-7-11 所 示 。 





图 9-7-11 





3. 后 面 的 变化 完全 类 似 ， 不 解释 ， 只 看 图 (图 9-7-12) 。 
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图 9-7-12 





最 终 束 得 到 一 个 完全 有 序 的 序列 了 。 


9.7.2 HEHE RRR ARE aH 





HEAP Ar HY BCR BURA Z tae? 我 们 来 分 析 一 下 。 





已 的 运行 时 间 主 要 是 消耗 在 初始 构建 堆 和 在 重建 堆 时 的 反复 自选 上 。 





在 构建 堆 的 过 程 中 ， 因 为 我 们 是 完全 二 又 树 从 最 下 层 最 右边 的 非 终端 结 
点 开始 构建 ， 将 它 与 其 孩子 进行 比较 和 行 有 必要 的 互 换 ， 对 于 每 个 非 终 
端 结 皮 来 说 ， 其 实 最 多 进行 两 次 比较 和 互 换 操作 ， 因 此 整个 构建 堆 的 时 
li] 32 AR BE O(n). 








在 正式 排序 时 ， 第 i 次 取 堆 顶 记录 重建 堆 需 要 用 O(logi) 的 时 间 (完全 二 
叉 树 的 某 个 结 点 到 根 结 点 的 距离 为 ) ， 并 且 需 要 取 n-1 次 堆 顶 记录 ， 因 
此 ， 重 建 堆 的 时 间 复 杂 上 度 为 O(nlogn)。 





所 以 总 体 来 说 ， 堆 排序 的 时 间 复 杂 度 为 Oologn)。 由 于 扒 排序 对 原始 记 
录 的 排序 状态 并 不 敏感 ， 因 此 它 无 论 是 最 好 、 最 坏 和 平均 时 间 复 杂 度 均 
为 OOnlogn)。 这 在 性 能 上 显然 要 远 远 好 过 于 冒 泡 、 简 单 选 择 、 直 接 插入 
的 Oo) 的 时 间 复 杂 度 了 。 





空间 复杂 度 上 ， 它 只 有 一 个 用 来 交换 的 暂 存 单元 ， 也 非常 的 不 错 。 不 过 
AO ie eee 
FI rae 


另外 ， 由 于 初始 构建 扒 所 需 的 比较 次 数 较 多 ， 因 此 ， 它 并 不 适合 竺 排序 
序列 个 数 较 少 的 情况 。 


9.8 ”归并 排序 


前 面 我 们 讲 了 堆 排 序 ， 因 为 它 用 到 了 完全 二 又 树 ， 充 分 利用 了 完全 二 又 
树 的 深度 是 llogznl+1 的 特性 ， 所 以 效率 比较 高 。 不 过 堆 结 构 的 设计 本 喘 
古 比 较 复杂 的 ， 老 实说 ， 能 想 出 这 样 的 结构 束 挺 不 容易 ， 有 没有 更 直接 
简单 的 办 法 利用 完全 二 又 树 来 排序 呢 ? 当然 有 。 





ea I 
来 的 吗 ? 


简单 地 说 ， 如 果 各 蜗 校 本 科 专 业 在 条 省 高 三 理科 学 生 中 计划 招收 1 万 
名 ， 那 么 将 全 省 参加 高 考 的 理科 学 生 分 数 倒 排序 ， 第 1 万 名 的 总 分 数 就 
是 当年 本 科 生 的 分 数 线 ( 现 实 可 能 会 比 这 复杂 ， 这 里 简化 之 ) 。 也 就 是 
说 ， 即 使 你 是 你 们 班级 第 一 、 甚 至 年 级 第 一 名 ， 如 果 你 没有 上 分 数 线 ， 
ED A 
儿 会 了 。 











换 句 话说 ， 所 谓 的 全 省 排名 ， 其 实 也 就 是 每 个 市 、 每 个 县 、 每 个 学 校 、 
每 个 班级 的 排名 合并 后 再 排名 得 到 的 。 注 意 我 这 里 用 到 了 合并 一 词 。 








我 们 要 比较 两 个 学 生 的 成 绩 高 低 是 很 容易 的 ， 比 如 甲 比 乙 分 数 低 ， 丙 比 
丁 分 数 低 。 那 么 我 们 也 就 可 以 很 容易 得 到 甲乙 丙丁 合并 后 的 成 绩 排名 ， 








全 省 学 生 的 成 绩 排 名 ， 此 时 高 考 状元 也 就 诞生 了 。 


为 了 更 清晰 地 说 清楚 这 里 的 思想 ， 大 家 来 看 图 9-8-1 所 示 ， 我 们 将 本 是 无 
序 的 数组 序列 {16,7,13,10,9,15,3,2,5,8,12,1,11,4,6,14}， 通 过 两 两 合并 排 
序 后 再 合并 ， 最 终 获 得 了 一 个 有 序 的 数组 。 注 意 仔 细 观 察 它 的 形状 ， 你 
会 发 现 ， 它 像 极 了 一 棵 倒置 的 完全 二 叉 树 ， 通 常 涉及 到 完全 二 叉 树 结构 
的 排序 算法 ， 效 率 一 般 都 不 低 的 一 一 这 就 是 我 们 要 讲 的 归并 排序 法 。 





e| (af (e Do fo) bs) Ll Ce dsd ded fel CE e e e 
wa pafe alt oo aa 
noos) eeo (elelee Lele foje 
gu 
ggggggggpoooogg 加 


图 9-8-1 


9.8.1 ”归并 排序 算法 





归并 ”一 词 的 中 文 含义 就 是 合并 、 并 入 的 意思 ， 而 在 数据 结构 中 的 定义 
征 将 两 个 或 两 个 以 上 的 有 序 表 组 合成 一 个 新 的 有 序 表 。 


归并 排序 (Merging Sort) 就 是 利用 归并 的 思想 实现 的 排序 方法 。 它 的 
原理 是 假设 初始 序列 含有 n 个 记录 ， 则 可 以 看 成 是 n 个 有 序 的 子 序 列 ， 
个 子 序列 的 长 度 为 1， 然 后 两 两 归并 ， 得 到 |n/2| (|x| 表 示 不 小 于 x 的 最 小 
整数 ) 个 长 度 为 2 或 1 的 有 序 子 序列 ， 再 两 两 归并 ，.……. ， 如 此 重复 ， 直 
至 得 到 一 个 长 度 为 np 的 有 序 序列 为 止 ， 这 种 排序 方法 称 为 2 路 归并 排序 。 

















好 了 ， 有 了 对 归并 排序 的 初步 认识 后 ， 我 们 来 看 代码 。 








/* 对 顺序 表 L 作 归并 排序 */ 
void MergeSort(SqList *L) 








MSort(L->r, L->r, 1, L->length); 





一 句 代 码 ， 别 奇怪 ， 它 只 是 调用 了 男 一 个 函数 而 已 。 为 了 与 前 面 的 排序 
算法 统一 ， 我 们 用 了 同样 的 参数 定义 SqList * 工 ， 由 于 我 们 要 讲解 的 归并 
排序 实现 需要 用 到 递归 调用 ， 因 此 我 们 外 封装 了 一 个 函数 。 假 设 现在 要 
对 数组 {50,10,90,30,70,40,80,60,20} 进 行 排序 ，L.length=9， 我 现 来 看 看 

MSort 的 实现 。 








/* ¥¢SR[s..t]JAIFHERATRI[s..t] */ 
vord MSont(ant SRI] P int TRI), int sS Intt) 








int m; 
int TR2 [MAXSIZE + 1]: 
if (S == t) 

TR1[s] = SR[s]; 
else 





/* 将 SR[s..t] 平 分 为 SR[s..m] 和 SR[m+1..t] */ 
Mp = (Sete) ayaa 2 

/* 递归 将 SR[s. my 并 为 有 序 的 TR2[s..m] */ 
MSort(SR, TR2, s, m): 

A 递归 将 SR[m+1 .t] 归 并 为 有 序 TR2[m+1..t] A 




















MSort(SR, TR2, m + 1, t); 

/* 将 TR2[s ， sn] TR2 aed. Hel) ey 
/* 归并 到 TR1[s..t] * 
Merge(TR2,TR1, s, m, t); 








} 
b 


1. MSort 被 调用 时 ，SR 与 TR1 都 是 {50,10,90,30,70,40,80,60,20}，s=1， 
t=9， 最 终 我 们 的 目的 就 是 要 将 TR1 中 的 数组 排 好 顺序 。 





2. 第 5 行 ， 显 然 s 不 等 于 t， 执 行 第 8 一 13 行 语句 块 。 


3. 第 9 行 ，m=(1+9)/2=5。m 就 是 序列 的 正中 间 下 标 。 


A. 此 时 第 10 行 ， 调 用 “MSort(SR,TR2,1,5);” 的 目标 就 是 将 数组 SR 中 的 第 
1 一 5 的 关键 字 归 并 到 有 序 的 TR2 〈 调 用 前 TR2 为 空 数 组 ) ， 第 11 行 ， 调 
用 “MSort(SR,TR2,6,9);” 的 目标 束 是 将 数组 SR 中 的 第 6 一 9 的 关键 字 归 并 
到 有 序 的 TR2。 也 就 是 说 ， 在 调用 这 两 句 代 码 之 前 ， 代 码 已 经 准备 将 数 
组 分 成 了 两 组 了 ， 如 图 9-8-2 所 示 。 
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图 9-8-2 


5. 第 12 行 ， 函 数 Merge 的 代码 细节 一 会 再 讲 ， 调 

用 “Merge(TR2,TR1,1,5,9);” 的 目标 其 实 就 是 将 第 10 和 11 行 代码 获得 的 数 
组 TR2 (注意 它 是 下 标 为 1 一 5 和 6 一 9 的 关键 字 分 别 有 序 ) 归并 为 TR1， 
此 时 相当 于 整个 排序 就 已 经 完成 了 ， 如 图 9-8-3 所 示 。 
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图 9-8-3 





6. 再 来 看 第 10 行 递归 调用 进去 后 ，s=1，t=5，m=(1+5)/2=3。 此 时 相当 
于 将 5 个 记录 拆 分 为 三 个 和 两 个 。 继 续 递 归 进 去 ， 直 到 细 分 为 一 个 记录 
填 入 TR2， 此 时 s 与 t 相 等 ， 递 归 返 回 ， 如 图 9-8-4 的 左 图 所 示 。 每 次 递归 
返回 后 都 会 执行 当前 递归 函数 的 第 12 行 ， 将 TR2 归 并 到 TR1 中 ， 如 图 9- 
8-4 的 右 图 所 示 ， 最 终 使 得 当前 序列 有 序 。 








图 9-8-4 


7. 同样 的 第 11 行 也 是 类 似 方式 ， 如 图 9-8-5 所 示 。 





图 9-8-5 


8. 此 时 也 就 是 刚才 所 讲 的 最 后 一 次 执行 第 12 行 代码 ， 将 
{10,30,50,70,90} 与 {20,40,60,80} 归 并 为 最 终 有 序 的 序列 。 











可 以 说 ， 如 果 对 递归 函数 的 运行 方式 理解 比较 透 的 话 ，MSort 函 数 还 是 
很 好 理解 的 。 我 们 来 看 看 整个 数据 变换 示意 图 ， 如 图 9-8-6 所 示 。 
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图 9-8-6 


现在 我 们 来 看 看 Merge 函 数 的 代码 是 如 何 实 现 的 。 


/* 将 有 序 的 SR[I. .m] 和 SR[m+1. .n] 归 并 为 有 序 的 
TR en 
vord Menge@net Skil, ant mR nm im; ent in)) 




















nM ES alia de lke 
/* 将 SR 中 记录 由 小 到 大 归并 入 TR */ 
for (j mt KN ] <= n; k++) 























RS 
TR[k] = SR[1++] 
else 
TR[k] = SRDE]; 


life (Cm) 
fOr (ee. al efi) Sake dla) 


/* 将 剩余 的 SR[i..m] 复 制 到 TR */ 
TRDKSE |=SRI | 





} 
RS 
{ 


TOE QES OF aS N E A ) 
/* 将 剩余 的 SR[j..n] 复 制 到 TR */ 
TR[k + 1] = SR[j + 1]: 





1. 假设 我 们 此 时 调用 的 Merge 束 是 将 {10,30,50,70,90} 45 {20,40,60,80} 月 
并 为 最 终 有 序 的 序列 ， 因 此 数组 SR 为 {10,30,50,70,90,20,40,60,80}， 
i=1, m=5, n=9。 





2. 第 4 行 ，for 循 环 ，j 由 m+1=6 开 始 到 9，i 由 1 开始 到 5，k 由 1 开始 每 次 加 
1，k 值 用 于 目标 数组 TR 的 下 标 。 


3. 第 6 行 ，SR[i]=SR[1]=10，SR[j]=SR[6]=20，SR[i]<SR[j]， 执 行 第 7 
行 ，TR[k]=TR[1]=10， 并 且 it++。 如 图 9-8-7 所 示 。 
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图 9-8-7 


A. 再 次 循环 ，k++ 得 到 k=2，SR[i]=SR[2]=30，SR[j]=SR[6]=20， 
SR[i]>SR[j]， 执 行 第 9 行 ，TR[k]=TR[2]=20， 并 且 j++， 如 图 9-8-8 所 示 。 
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图 9-8-8 


5. 再 次 循环 ，k++ 得 到 k=3，SR[i]=SR[2]=30，SR[j]=SR[7]=40，SR[i] 
<SR[j]， 执 行 第 7 行 ，TR[k]=TR[3]=30， 并 且 i++， 如 图 9-8-9 所 示 。 
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图 9-8-9 


6. eee 一 直到 j++ 后 ，j=10， 大 于 9 退出 循环 ， 如 
图 9-8-10 所 示 
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图 9-8-10 





7. 第 11 一 20 行 的 代码 ， 其 实 就 将 归并 剩 下 的 数组 数据 ， 移 动 到 TR 的 后 
面 。 当 前 k=9，i=m=5， 执 行 第 13 一 20 行 代码 ，for 循 环 ]=0， 
TRI[k+ll=SR[i+l]=90, 大 功 告 成 。 





束 这 样 ， 我 们 的 归并 排序 就 算是 完成 了 一 次 排序 工作 ， 怎 么 样 ， 和 堆 排 
序 比 ， 是 不 是 要 简单 一 些 呢 ? 





9.8.2 ”归并 排序 复杂 上 度 分 析 





我 们 来 分 析 一 下 归并 排序 的 时 间 复 杂 度 ， 一 趟 归并 需要 将 SR[1 一 SRrm] 
中 相 邻 的 长 度 为 hn 的 有 序 序列 进行 两 两 归并 。 并 将 结果 放 到 TR1[1] 一 

TR1l[n] 中 ， 这 需要 将 待 排序 序列 中 的 所 有 记录 扫描 一 裔 ， 因 此 耗费 O(n) 
时 间 ， 而 由 完全 二 又 树 的 深度 可 知 ， 整 个 归并 排序 需要 进行 次 ， 因 此 ， 
a cdenanen ene 
的 時 同性 能 














由 于 归并 排序 在 归并 过 程 中 需要 与 原始 记录 序列 同样 数量 的 存储 空间 存 
放 归 并 结果 以 及 递归 时 深度 为 log 


2n 的 栈 空 间 ， 因 此 空间 复杂 度 为 OOn+logn)。 


男 外 ， 对 代码 进行 仔细 研究 ， 发 现 Merge 函 数 中 有 if(SR[i]<SRIj]) 语 句 ， 
eae 需要 两 两 比较 ， 不 存在 跳跃 ， 因 此 归并 排序 是 一 种 稳定 的 排 














也 就 是 次 ， 归 并 排序 是 一 种 比较 占用 内 存 ， 但 却 效率 高 且 稳定 的 算法 。 


9.8.3 ” 非 递归 实现 归并 排序 











我 们 第 说 ,，“ 没 有 最 好 ， 只 有 更 好 。” 归 并 排 订 大量 引用 了 递归 ， 尺 管 在 
代码 上 比较 清晰 ， 容 易 理 解 ， 但 这 会 造成 时 间 和 空 = 间 上 的 性 能 损耗 。 我 
们 排序 追求 的 就 是 效率 ， 有 没有 可 能 将 递归 转化 成 欠 代 呢 ? 结论 当然 是 
可 以 的 ， 而 且 改 动 之 后 ， 性 能 上 进一步 提高 了 ， 来 看 代码 。 














/* 对 顺序 表 L 作 归并 非 递归 排序 */ 
void MergeSort2(SqList *L) 
{ 




















al 请 额外 空间 a 
IUE D = (int *)malloc(L->length * sizeof(int)); 





int k = 

while ee < L ->1endgth ) 

{ 
MergePass(L->r, J5 k, L->length); 
/ 子 序列 长 度 如 僧 “ 
k=2* k; 
MergePass(TR, L- 9 k, L->1ength) ， 
/* 子 序列 基 度 加 倍 * 
Kea 2E | 





1. 程序 开始 执行 ， 数 组 工 为 {50,10,90,30,70,40,80,60,201}，L.length=9。 
2. 第 3 行 ， 我 们 事先 申请 了 额外 的 数组 内 存 空 间 ， 用 来 存放 归并 结 


3. 第 5 一 11 行 ， 是 一 个 while 循 环 ， 目 的 是 不 断 地 归并 有 序 序列 。 注 意 k 
o 第 8 行 与 第 10 行 ， 在 不 断 循环 中 ， 它 将 由 1 -248 一 16， 
跳出 循环 。 


4. 第 7 行 ， 此 时 k=1，MergePass 函 数 将 原来 的 无 序数 组 两 两 归并 入 
TR《〈 此 函数 代码 稍 后 再 讲 ) ， 如 图 9-8-11 所 示 。 





图 9-8-11 
De MoT =25 


. 第 9 行 ，MergePass 函 数 将 TR 中 已 经 两 两 归并 的 有 序 序 列 再 次 归并 回 
直し rH, 如 図 9-8-12 所 示 。 





7. 第 10 行 ，k=4， 因 为 k<9， 所 以 继续 循环 ， 再 次 归并 ， 最 终 执 行 完 第 7 
一 10 行 ，k=16， 结 束 循环 ， 完 成 排序 工作 ， 如 图 9-8-13 所 示 。 
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NASH, FRAT HENS RS BI, APRA iS EMER T 5, 人 最小 
的 序列 开始 归并 下 至 完成 。 不 需要 像 归 并 的 递归 算法 一 样 ， 需 要 先 拆 分 
递归 ， 再 归并 退出 递归 。 





图 9-8-13 





现在 我 们 来 看 MergePass 代 人 码 是 如 何 实现 的 。 





/* 将 SR[] 中 相 邻 长 度 为 s 的 子 序列 两 两 归并 到 TR[] */ 
void MergePass(1nt SR[] , int TR[], int s, int n) 
{ 








ali ee = ale 
amey 
whaea (TEn Dees STE 





A AVE 
Menge (SR AIR I ES 2 andy) 
TEE ZES 
y 
/* 归并 最 后 两 个 序列 */ 
NM (CS ap) 
Merge(SR, TR, i, i+ s - 1, n); 
/* 若 最 后 只 剩 下 单个 子 序列 */ 
else 
TO (J ln es = Ae ata) 
TREGIC= SRG 











1. 程序 执行 。 我 们 第 一 次 调用 *MergePass(L.rTR,k,L.lengthb);”， 此 时 EL 
是 初始 无 序 状态 ，TR 为 新 申请 的 空 数组 ，k=1，L.length=9。 


2. 第 5 一 9 行 ， 循 环 的 目的 就 两 两 归并 ， 因 s=1，n-2xs 十 1=8， 为 什么 循 
环 i 从 1 到 8， 而 不 是 9 呢 ? 就 是 因为 两 两 归并 ， 基 终 9 条 记录 定 会 剩 下 
来 ， 无 法 归并 。 








3. 第 7 行 ，Merge 函 数 我 们 前 面 已 经 详细 讲 过 ， 此 时 ji=1，i 十 S-1=1，i 十 
2xs-1=2。 也 就 是 说 ， 我 们 将 SR ( 即 Lr) 中 的 第 一 个 和 第 二 个 记录 归并 
到 TR 中 ， 然 后 第 8 行 ，i=i 十 2xs=3， 再 循环 ， 我 们 就 是 将 第 三 个 和 第 四 
个 记录 归并 到 TR 中 ， 一 直到 第 七 和 第 八 个 记录 完成 归并 ， 如 图 9-8-14 所 
示 。 





图 9-8-14 


4. 第 10 一 14 行 ， 主 要 是 处 理 最 后 的 尾数 ， 第 11 行 是 识 将 最 后 剩 下 的 多 
个 记录 归并 到 TR 中 。 不 过 由 于 i=9，n-s 十 1=9， 因 此 执行 第 13 一 14 行 ， 
将 20 放 入 到 TR 数 组 的 最 后 ， 如 图 9-8-15 所 示 。 





图 9-8-15 


5. 再 次 调用 MergePass 时 ，s=2， 第 5 一 9 行 的 循环 ， 由 第 8 行 的 i=i 十 2xs 
可 知 ， 此 时 i 就 是 以 4 为 增 量 进行 循环 了 ， 也 就 是 说 ， 是 将 两 个 有 两 个 记 
录 的 有 序 序列 进行 归并 为 四 个 记录 的 有 序 序列 。 最 终 再 将 最 后 剩 下 的 第 
九条 记录 “20” 插 入 TR， 如 图 9-8-16 所 示 。 











图 9-8-16 
6. 后 面 的 类 似 ， 略 。 


非 递 归 的 迭代 方法 ， 避 免 了 递归 时 深度 为 log2n 的 栈 空间 ， 空 间 只 是 用 到 
申请 归并 临时 用 的 TR 数 组 ， 因 此 空间 复杂 上 度 为 0mD)， 并 且 避 免 递 归 也 在 
人 
月 方 法 。 








9.9 ”快速 排序 


终于 我 们 的 高 手 要 登场 了 ， 如 宋 将 来 你 工作 后 ， 你 的 老板 要 让 你 写 个 排 
序 算法 ， 而 你 会 的 算法 中 竟然 没有 快速 排序 ， 我 想 你 还 是 不 要 声张 ， 偷 
偷 去 把 快速 排序 算法 找 来 融 进 电脑 ， 这 样 至 少 你 不 至 于 被 大 伙 儿 取笑 。 


事实 上 ， 不 论 是 C++ STL. Java SDK 或 者 .NETFrameWork SDK 等 开发 工 
具 包 中 的 源 代码 中 都 能 找到 它 的 某 种 实现 版 本 。 





快速 排序 算法 最 早 由 图 灵 奖 获得 者 TonyHoare 设 计 出 来 的 ， 他 在 形式 化 
方法 理论 以 及 AL-GOL60 编 程 语言 的 发 明 中 都 有 卓越 的 贡献 ， 是 上 世纪 
AA 
站 小 发 明 而 已 。 





更 牛 的 是 ， 我 们 现在 要 学 习 的 这 个 快速 排序 算法 ， 被 列 为 20 世 纪 十 大 算 
法 之 一 。 我 们 这 些 玩 编程 的 人 还 有 什么 理由 不 去 学 习 它 呢 ? 


布尔 排序 相当 于 直接 插入 排序 的 升级 ， 它 们 同属 于 插入 排序 类 ， 堆 排序 
相当 于 简单 选择 排序 的 升级 ， 它 们 同属 于 选择 排序 类 。 而 快速 排序 其 实 
就 是 我 们 前 面 认为 最 慢 的 骨 泡 排序 的 升级 ， 它 们 都 属于 交换 排序 类 。 即 
它 也 是 通过 不 断 比较 和 移动 交换 来 实现 排序 的 ， 只 不 过 它 的 实现 ， 增 大 
了 记录 的 比较 和 移动 的 距离 ， 将 关键 字 较 大 的 记录 从 前 面 下 接 移动 到 后 
面 ， 关 键 字 较 小 的 记录 从 后 面 直接 移动 到 前 面 ， 从 而 减少 了 总 的 比较 次 
数 和 移动 交换 次 数 。 

















9.9.1 快速 排序 算法 


快速 排序 (Quick Sort) 的 基本 思想 是 : 通过 一 趟 排序 将 待 排 记 录 分 割 
成 独立 的 两 部 分 ， 基 中 一 部 记录 的 关键 字 均 比 另 一 部 分 记录 的 关键 字 
人 则 可 分 别 对 这 两 部 分 记录 继续 进行 排序 ， 以 达到 整个 序列 有 序 的 目 








从 字面 上 感觉 不 出 它 的 好 处 来 。 假 设 现在 要 对 数组 
k 1 n ,70,40,80,60,20} 进 行 排序 。 我 们 通过 代码 的 讲解 来 学 习 快 速 
FE 序 的 精妙 


我 们 来 看 代码 。 


/* 对 顺序 表 L 作 快速 排序 */ 
void QuickSort(SqList *L) 


QSort(L, 1, L->length); 


又 是 一 名 代码， 和 归并 排序 一 样 ， 由 于 需要 递归 调用 ， 因 此 我 们 外 封装 
了 一 个 函数 。 现 在 我 们 来 看 QSort 的 实现 。 





从 对 顺序 表 L 中 的 子 序列 L->r [low. .high] 作 快速 排 
Be ey 

void QSort(SqList *L, int low, int high) 
a 


int pivot; 
if (low < high) 
{ 


/* ¥L->r[low..high]—-7AL, */ 
/* 算出 枢 轴 值 pivot */ 

pivot = Partition(L, low, high); 
/* 对 低 子 表 递 归 排 序 */ 

QSort(L, low, pivot - 1); 

/* 对 高 子 表 递归 排序 */ 

QSort(B pivot er lo hal) 








从 这 里 ， 你 应 该 能 理解 前 面 代 码 “QSort(L,1,L->length);” 中 1 和 L->length 


代码 的 意思 了 ， 它 就 是 当前 待 排序 的 序列 最 小 下 标 值 low 和 最 大 下 标 值 
high. 








一 段 代码 的 核心 是 “pivot=Parti-tion(L,low,high);* 在 执行 它 之 前 ，L.r 的 
ae isan una Partition 函数 要 做 的 ， 就 是 先 选 
取 当 中 的 一 个 关键 字 ， 比 如 选择 第 一 个 关键 字 50， 然 后 想 尽 办 法 将 它 放 
到 一 个 位 置 ， 使 得 它 左 边 的 值 都 比 它 小 ， 右 边 的 值 比 它 大 ， 我 们 将 这 样 
的 关键 字 称 为 枢 轴 Cpivot) 。 


在 经 过 Partition(L,1,9) 的 执行 之 后 ， 数组 变 成 
{20,10,40,30,50,70,80,60,90}， 并 返回 值 5 给 pivot， 数 字 5 表 明 50 放 置 在 数 
组 下 标 为 5 的 位 置 。 此 时 ， 计 算 机 把 原来 的 数组 变 成 了 两 个 位 于 50 左 和 
右 小 数组 {20,10,40,30} 和 {70,80,60,90}， 而 后 的 递归 调用 “QSort(L,1,5- 
1);” 和 “QSort(L,5+1,9);” 语 句 ， 其 实 束 是 在 对 {20,10,40,30} 和 
{70,80,60,90} 分 别 进行 同样 的 Partition 操 作 ， 直 到 顺序 全 部 正确 为 止 。 


到 了 这 里 ， 应 该 说 理解 起 来 还 不 算 困 难 。 下 面 我 们 就 来 看 看 快速 排序 最 
关键 的 Partition 函 数 实 现 。 











ie paces AEs 使 枢 轴 记录 到 位 ， 
并 返回 其 所 在 位 

/* 此 时 在 它 之 前 (后 ) MERIR CVET 
ia A 

int Partition(SqList *L, int low, int high) 





















































int pivotkey; 
/* 用 子 表 的 第 一 个 记录 作 枢 轴 记 录 */ 
pivotkey = L->r[low]; 
ie 从 表 的 两 端 交 蔡 向 中 间 扫 yA 
while (low < high) 

{ 












































while ce < high && L->r[high] >= pivotkey) 
hig 

Us SERERE SI “7 

swap(L, low, high); 

while (low < high && L->r[low] <= pivotkey) 
low++; 

/* 将 比 枢 轴 记录 大 的 记录 交换 到 高 端 * / 

swap(L, low, high); 


} 
/* 返回 枢 轴 所 在 位 置 */ 


return low; 


























1. 程序 开始 执行 ， 此 时 low=1，high=L.length=9。 第 4 行 ， 我 们 将 
L.r[low]=L:r[1]=50 赋 值 给 枢 轴 变 量 piv-otkey， 如 图 9-9-1 所 示 。 


下 标 0 1 2 3 4 5 6 7 8 0 
00000000 


pivotkey=50 low high 





图 9-9-1 


2. 第 5 一 13 行 为 while 循 环 ， 目 前 low=1<high=9， 执 行内 部 语句 。 





ノー を と 


3. 第 7 行 , L.rfhigh]=L.r[9]=20>+piv-otkey=50, 因 此 不 拠 行 第 8 行 。 


4. 第 9 行 , 交換 L.rllow] 与 L.rIhigh] 的 値 , 使 得 L.r[1]=20, L.r[9]=50. AW 
什么 要 交换 ， 就 是 因为 通过 第 7 行 的 比较 知道 ，L:r[high] 是 一 个 比 
pivotkey=50 ( 即 L.rllow]) 还 要 小 的 值 ， 因 此 它 应 该 交换 到 50 的 左 侧 ， 
如 图 9-9-2 所 示 。 


下 标 0 


wm 


pivotkey=30 low high 





图 9-9-2 


5. 第 10 行 ， 当 L.r[low]=L.r[1]=20，piv-otkey=50，L.r[low]<pivotkey， 因 
此 第 11 行 ，low++， 此 时 low=2。 继 续 循 环 ，L.r[2]=10<50，low++， 此 
时 low=3。L:r[3]=90>50， 退 出 循环 。 


6. 第 12 行 ， 交 换 L.r[low]=L.:r[3] 与 L.r[high]=L.r[9] 的 值 ， 使 得 
L.r[3]=50，L.r[9]=90。 此 时 相当 于 将 一 个 比 50 大 的 值 90 交 换 到 了 50 的 右 
边 。 注 意 此 时 low 已 经 指向 了 3， 如 图 9-9-3 所 示 。 


下 标 0 





PEPP 


pivotkey=50 low high 


图 9-9-3 
7. 继续 第 5 行 ， 因 为 low=3<high=9， 执 行 循环 体 。 


8. 第 7 行 , 当 L.r[high]=L.r[9]=90, piv-otkey=50, L.r[high]>pivotkey, 
因此 第 8 行 ，high--， 此 时 high=8。 继 续 循 环 ，L.r[8]=60>50，high--， 此 
时 high=7。L.r[7]=80>50，high--， 此 时 high=6。L.r[6]=40<50， 退 出 循 
环 。 


9. 第 9 行 ， 交 换 L.r[low]=L.r[3]=50 与 L.r[high]=L.r[6]=40 的 值 ， 使 得 
L.r[3]=40，L.r[6]=50， 如 图 9-9-4 所 示 。 


Pr 0 1 2 3 4 5 6 7 8 9 
| moins namias 


pivotkey=50 low high 





图 9-9-4 


10. 第 10 行 ， 当 L.r[low]=L.r[3]=40，Ppiv-otkey=50，L.r[low]<pivotkey， 
因此 第 11 行 ，low++， 此 时 low=4。 继 续 循 环 L.r[4]=30<50，low++， 此 
时 low=5。L:r[5]=70>50， 退 出 循环 。 


11. 第 12 行 ， 交 换 L.r[low]=L.r[5]=70 与 L.r[high]=L.r[6]=50 的 值 ， 使 得 


L.r[5]=50, L.r[6]=70, 如 図 9-9-5 所 示 。 


My 0 


PP 


pivotkey=50) low} | high 





图 9-9-5 


12. 再 次 循环 。 因 low=5<high=6， 执 行 循 环 体 后 ，low=high=5， 退 出 循 
环 ， 如 图 9-9-6 所 示 。 


下 标 0 
Bee 


pivotkey=50 low] | high 





图 9-9-6 





13. 最 后 第 14 行 ， 返 回 low 的 值 5。 函 数 执行 完成 。 接 下 来 就 是 递归 调 
FA“QSort(L,1,5-1);” F“QSort(L,5+1,9);"i8 J, 対 {20,10,40,30} 和 
{70,80,60,90} 分 别 进 行 同 样 的 Partition 操 作 ， 直 到 顺序 全 部 正确 为 止 。 我 
们 就 不 再 演示 了 。 


通过 这 段 代 码 的 模拟 ， 大 家 应 该 能 够 明白 ，Partition 函 数 ， 其 实 就 是 将 
选取 的 pivotkey 不 断交 换 ， 将 比 它 小 的 换 到 它 的 左边 ， 比 它 大 的 换 到 它 
的 右边 ， 它 也 在 交换 中 不 断 更 改 自 己 的 位 置 ， 直 到 完全 满足 这 个 要 求 为 
ies 





9.9.2 ”快速 排序 复杂 度 分 析 


我 们 来 分 析 一 下 快速 排序 法 的 性 能 。 快 速 排序 的 时 间 性 能 取决 于 快速 排 
序 递归 的 深度 ， 可 以 用 递归 树 来 描述 递归 算法 的 执行 情况 。 如 图 9-9-7 所 
示 ， 它 是 {50,10,90,30,70,40,80,60,20} 在 快速 排序 过 程 中 的 递归 过 程 。 由 
于 我 们 的 第 一 个 关键 字 是 50， 正 好 是 竺 排序 的 序列 的 中 间 值 ， 因 此 递归 
树 是 平衡 的 ， 此 时 性 能 也 比较 好 。 








图 9-9-7 








在 最 优 情 况 下 ，Partition 每 次 都 划分 得 很 均匀 ， 如 宋 排 序 n 个 关键 字 ， 其 
递归 树 的 深度 就 为 《表示 不 大 于 x 的 最 大 整数 ) ， 即 仅 需 递归 log2n 次 ， 





需要 时 间 为 T(n) 的 话 ， 第 一 次 Par-tiation 应 该 是 需要 对 整个 数组 扫描 一 
遍 ， 做 n 次 比较 。 然 后 ， 获 得 的 枢 轴 将 数组 一 分 为 二 ， 那 么 各 自 还 需要 
T(n/2) 的 时 间 (注意 是 最 好 情况 ， 所 以 平分 两 半 )〉。 于 是 不 断 地 划分 下 
去 ， 我 们 就 有 了 下 面 的 不 等 式 推断 。 








OD Ss tn .270 sp iy E = o 
mn) s 22mm 7 4) + n 7 2) + n= 4i(n 7 4) +2n 
T(n) s 4(2T(n / 8) + n / 4) + 2n = 8T(n / 8)+3n 


T(n) < nT(1) + (1og2n) x n = O(nlogn) 


也 就 是 次 ， 在 最 优 的 情况 下 ， 快 速 排序 算法 的 时 间 复 杂 度 为 OOnlogn)。 











在 最 坏 的 情况 下 ， 待 排序 的 序列 为 正 序 或 者 逆序 ， 每 次 划分 只 得 到 一 个 
比 上 一 次 划分 少 一 个 记录 的 子 序 列 ， 注 意 另 一 个 为 空 。 如 果 递 归 树 画 出 
来 ， 它 就 是 一 村 和 斜 树 。 此 时 需要 执行 n-1 次 递归 调用 ， 且 第 i 次 划分 需要 
经 过 n-i 次 关键 字 的 比较 才能 找到 第 i 个 记录 ， 也 就 是 枢 轴 的 位 置 ， 因 此 
比较 次 数 为 sigma(i=1, n-1, n-i)=(n-1)+(n-2)+...+1=n(n-1)/2， 最 终 其 时 间 复 
FENOM?) 


平均 的 情况 ， 设 枢 轴 的 关键 字 应 该 在 第 k 的 位 置 て 1sksn) , WA: 
] n / n 
T(n)=-Y (1(k-1)+T(n-k))+n=—) TUK tn 


Hj M kz 


由 数学 归纳 法 可 证 明 ， 其 数量 级 为 O(nlogn)。 


就 空间 复杂 上 度 来 说 ， 主 要 是 递归 造成 的 栈 空间 的 使 用 ， 最 好 情况 ， 弟 归 
树 的 深度 为 logan， 其 空间 复杂 上 度 也 就 为 O(logn)， 最 坏 情况 ， 需 要 进行 n- 





1 递归 调用 ， 其 空间 复杂 度 为 O(n)， 平 均 情况 ， 空 间 复 杂 度 也 为 
O(logn)。 


可 惜 的 是 ， 由 于 关键 字 的 比较 和 交换 是 跳跃 进行 的 ， 因 此 ， 快 速 排 序 是 
一 种 不 稳定 的 排序 方法 。 


9.9.3 ”快速 排序 优化 





刚才 讲 的 快速 排序 还 是 有 不 少 可 以 改进 的 地 方 ， 我 们 来 看 一 些 优化 的 方 


AN 


1. 优化 选取 枢 轴 


如 果 我 们 选取 的 pivotkey 是 处 于 整个 序列 的 中 间 位 置 ， 那 么 我 们 可 以 将 
整个 序列 分 成 小 数 集合 和 大 数 集 合 了 。 但 注意 ， 我 刚才 说 的 是 “如 

果 ...... 是 中 间 *， 那 么 假如 我 们 选取 的 pivotkey 不 是 中 间 数 又 如 何 呢 ? 比 
如 我 们 前 面 讲 冒 泡 和 简单 选择 排序 一 直 用 到 的 数组 {9,1,5,8,3,7,4,6,2}， 

由 代码 第 4 行 “pivotkey=L->r[low];” 知 道 ， 我 们 应 该 选取 9 作为 第 一 个 枢 
轴 pivotkey。 此 时 ， 经 过 一 轮 “pivot=Partition(L,1,9);” 转 换 后 ， 它 只 是 更 
换 了 9 与 2 的 位 置 ， 并 且 返 回 9 给 pivot， 整 个 系列 并 没有 实质 性 的 变化 ， 

如 图 9-9-8 所 示 。 





fk 0 1 2 3 45 6 7 8 9 





pivotkey=9 low} | high 


图 9-9-8 


就 是 次 ， 代 码 第 4 行 “pivotkey=L->r[low];” 变 成 了 一 个 洪 在 的 性 能 瓶颈 。 
排序 速度 的 快慢 取决 于 Lr[IH] 的 关键 字 处 在 整个 序列 的 位 置 ，L:r[H] 太 小 


MAAK, 都会 影 咽 性 能 ( 比 如 第 一 例 子 中 的 50 就 赴 一 人 中 同数 , 面 第 
二 例子 的 9 就 是 一 个 相对 整个 序列 过 大 的 数 )。 因 为 在 现实 中 ， 待 排序 的 
系列 极 有 可 能 是 基本 有 序 的 ， 此 时 ， 总 是 固定 选取 第 一 个 关键 字 《〈 其 实 
oe VE ATE PARA at RIM SIR AARNE 
理 的 作法 。 








改进 办 法 ， 有 人 提出 ， 应 该 随机 获得 一 个 low 与 high 之 间 的 数 md， 让 它 
的 关键 字 L.r[md] 与 L.r[low] 交 换 ， 此 时 束 不 容易 出 现 这 样 的 情况 ， 这 被 
称 为 随机 选取 枢 轴 法 。 应 该 说 ， 这 在 某 种 程度 上 ， 人 解决 了 对 于 基本 有 序 
的 序列 快速 排序 时 的 性 能 瓶颈 。 不 过 ， 随 机 就 有 些 撞 大 运 的 感觉 ， 万 一 
没 撞 成 功 ， 随 机 到 了 依然 是 很 小 或 很 大 的 关键 字 怎 么 办 呢 ? 














再 改进 ， 于 是 就 有 了 三 数 取 中 (median-of-three) 法 。 即 取 三 个 关键 字 
先 送 行 排 序 , 格 中 同数 作 妨 枢 箱 , 一 般 走 取 左 端 、 右 端 和 中 回 三 介 数 , 
也 可 以 随机 选取 。 这 样 至 少 这 个 中 间 数 一 定 不 会 是 最 小 或 者 最 大 的 数 ， 
从 概率 来 说 ， 取 三 个 数 均 为 最 小 或 最 大 数 的 可 能 性 是 微乎其微 的 ， 因 此 
中 间 数 位 于 较为 中 则 的 值 的 可 能 性 就 大 大 提高 了 。 由 于 整个 序列 是 无 序 
状态 ， 随 机 选取 三 个 数 和 从 左 中 右 端 取 三 个 数 其 实 是 一 回 事 ， 而 且 随 机 
数 生 成 恬 本 刁 还 会 带 来 时 间 上 的 开销 ， 因 此 随机 生成 不 予 考 虑 。 




















我 们 来 看 看 取 左 端 、 右 并 和 中 间 三 个 数 的 实现 代码 ， 在 Partition 函 数 代 
码 的 第 3 行 与 第 4 行 之 间 增 加 这 样 一 段 代 码 。 





int pivotkey; 
/* 计算 数组 中 间 的 元 素 的 下 标 */ 
int m = low + (high - low) / 2; 
if (L->r[low] > L->r[high] ) 
/* 交换 左 端 与 右 端 数据 ， 保 证 左 端 较 小 */ 
swap(L, low, high); 
if (L->r[m] > L->r[high]) 
/* 交换 中 间 与 右 端 数据 ， 保 证 中 间 较 小 */ 
swap(L, high, m); 
if (L->r[m] > L->r[1ow] ) 
/* 交换 中 间 与 左 端 数据 ， 保 证 左 端 较 小 */ 
swap(L, m, low); 
/* 此 时 L.r[low] 已 经 为 整个 序列 左 中 右 三 个 关键 字 的 中 间 值 。 */ 
/* 用 子 表 的 第 一 个 记录 作 枢 轴 记 录 */ 
pivotkey = L->r[low]; 
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试想 一 下 ， 我 们 对 数组 {9,1,5,8,3,7,4,6,2}， 取 左 9、 中 3、 右 2 来 比较 ， 使 
得 L.r[low]=3， 一 定 要 比 9 和 2 来 得 更 为 合理 。 


三 数 取 中 对 小 数组 来 说 有 很 大 的 概率 选择 到 一 个 比较 好 的 pivotkey， 但 
是 对 于 非常 大 的 待 排序 的 序列 来 说 还 是 不 足以 保证 能 够 选择 出 一 个 好 的 
pivotkey， 因 此 还 有 个 办 法 是 所 谓 九 数 取 中 (me-dian-of-nine〉， 它 先 从 
数组 中 分 三 次 取样 ， 每 次 取 三 个 数 ， 三 个 样品 各 取出 中 数 ， 然 后 从 这 三 
个 中 数 当 中 再 取出 一 个 中 数 作为 枢 轴 。 显 然 这 就 更 加 保证 了 取 到 的 
pivotkey 是 比较 接近 中 间 值 的 关键 字 。 有 兴趣 的 同学 可 以 自己 去 实现 一 
下 代码 ， 这 里 不 再 详 述 了 。 











2. 优化 不 必要 的 交换 


观察 图 9-9-1 一 图 9-9-6， 我 们 发 现 ，50 这 个 关键 字 ， 其 位 置 变化 是 
1>9- -36-5， 可 其 实 它 的 最 终 目 标 就 是 5， 当 中 的 交换 其 实 是 不 需要 
的 。 因 此 我 们 对 Partition 函 数 的 代码 再 进行 优化 。 








/* 快速 排序 优化 算法 */ 
int Partitioni(SqList *L, int low, int high) 





int pivotkey; 
/* 这 里 省 略 三 数 取 中 代码 */ 
/* 用 子 表 的 第 一 个 记录 作 枢 轴 记 录 */ 






































pivotkey = L- ate 

/* 将 枢 轴 关 键 字 备份 到 L->r[9] */ 
L->r[0] = Bay Oey 

/* 从 表 的 两 端 交替 向 中 间 扫 描 * / 
while (low < high) 



































while oui < high && L->r[high] >= pivotkey) 
high- 

if 采用 茶 换 而 不 是 交换 的 方式 进行 操作 FH 

L->r[low] = L->r[high]; 

while (low < high && L->r[low] <= pivotkey) 
low++; 

/* 采用 蔡 换 而 不 是 交换 的 方式 进行 操作 */ 

L->r[high] = L->r[low]; 


























} 

/* 将 枢 轴 数值 替换 回 L.r[low] */ 
L->r[low] = L->r[0]; 

/* 返回 枢 轴 所 在 位 置 */ 


return low; 














注意 代码 中 加 粗 部 分 的 改变 。 我 们 事实 将 piv-otkey 备 份 到 L.r[0] 中 ， 然 后 
在 之 前 是 swap 时 ， 只 作 蔡 换 的 工作 ， 最 终 当 low 与 high 会 合 ， 即 找到 了 
枢 轴 的 位 置 时 ， 再 将 L.r[0] 的 数值 赋值 回 L.r[low]。 因 为 这 当中 少 了 多 次 
交换 数据 的 操作 ， 在 性 能 上 又 得 到 了 部 分 的 提高 。 如 图 9-9-9 所 示 。 


ーー 注意 近 里 し .r[0]=pivotkey: 
FER H 1 2 3 4 5 6 7 8 9 
50 | 10 | 90 | 30 | 70 | 40 | 80 | 60 | 20 | 
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pivotkey=50 low 
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pivotkey=50 low high 
FER 0 1 2 3 4 5 6 fi 8 9 
50] 20] 10 [oo [3o [7o [40] 0 Jeo [oo 
Piyotkey=S0 low ーーーー ぞ high 
FER 0 1 2 3 4 5 6 7 8 9 
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pivotke y=50 low high 
PA O tL zZz 45S g a BS y7 g 9 
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下 标 0 1 2 3 十 5 6 


7 8 9 
[50] 20] 10 [40 [30] 70] 70] 60 [so [50 


low| | high 








pivotke y=50 
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ーー 注意 返 里 L.r[low]=L.r[O]: 


图 9-9-9 


3. 优化 小 数组 时 的 排序 方案 


对 于 一 个 数学 科学 家 、 博 士 生 导 师 ， 他 可 以 攻克 世界 性 的 难题 ， 可 以 培 
养 最 优 夯 的 数学 博士 ， 但 让 他 去 教 小 学 生 “1+1=2” 的 算术 诬 程 ， 那 还 真 
未 必 会 比 和 常年 在 小 学 里 耕耘 的 数学 老师 教 得 好 。 换 句 话 说 ， 大 材 小 用 有 
时 会 变 得 反而 不 好 用 。 刚 才 我 痰 到 了 对 于 非常 大 的 数组 的 解决 办 法 。 那 
么 相反 的 情况 ， 如 果 数 组 非常 小 ， 其 实 快速 排序 反而 不 如 直接 插入 排序 
来 得 更 好 《直接 插入 是 简单 排序 中 性 能 最 好 的 ) 。 其 原因 在 于 快速 排序 
用 到 了 递归 操作 ， 在 大 量 数据 排序 时 ， 这 点 性 能 影响 相对 于 它 的 整体 算 
法 优势 而 言 是 可 以 忽略 的 ， 但 如 果 数 组 只 有 几 个 记录 需要 排序 时 ， 这 区 
成 了 一 个 大 炮 打 蚊子 的 大 问题 。 因 此 我 们 需要 改进 一 下 QSort 函 数 。 














#define MAX_LENGTH_INSERT_SORT 7 /* 数组 长 度 阀 值 */ 
/* 对 顺序 表 L 中 的 子 序列 L.r[low. .high] 作 快速 排序 */ 

void QSort(SqList &L, int low, int high) 

{ 








Init DO ty 
if ((high - low) > MAX_LENGTH_INSERT_SORT) 























/* 当 high- rS Ui S 
Ve FL. D Thighs E A 
ip 出 枢 轴 值 pivot Ti 


























pivot = = EE low, high); 
人 





























对 低 子 表 递 归 排 序 * 
low, ns een) 
* 对 高 子 表 递归 排序 */ 
oe pavot sy ls hagh) 
} 
else 
/* 当 high-1low 小 于 等 于 常数 时 用 直接 插入 排序 */ 
InsertSort(L); 


我 们 增加 了 一 个 判断 ， 当 high-low 不 大 于 某 个 常数 时 (有 资料 认为 7 比较 
合适 ， 也 有 认为 50 更 合理 ， 实 际 应 用 可 适当 调整 ) ， 就 用 直接 插入 排 
序 ， 这 样 就 能 保证 最 大 化 地 利用 两 种 排 友 的 优势 来 完成 排序 工作 。 


4. 优化 递归 操作 





大 家 知道 ， 递 归 对 性 能 是 有 一 定 影响 的 ，QSort 函 数 在 其 尾部 有 两 次 递 
归 操 作 。 如 果 行 排序 的 序列 划分 极端 不 平衡 ， 递 归 深 度 将 趋 近 于 n， 而 
不 是 平衡 时 的 log 








2n， 这 就 不 仅仅 是 速度 快慢 的 问题 了 。 栈 的 大 小 是 很 有 限 的 ， 每 次 递归 
调用 都 会 耗费 一 定 的 栈 空间 ， 函 数 的 参数 越 多 ， 每 次 递归 耗费 的 空间 也 
越 多 。 因 此 如 采 能 减少 递归 ， 将 会 大 大 提高 性 能 。 


于 是 我 们 对 QSort 实 施 尾 递归 优化 。 来 看 代码 。 





/* 对 顺序 表 L 中 的 子 序列 L.r[low. .high] 作 快速 排序 */ 
void QSorti(SqList *L, int low, int high) 


int pivot; 
if ((high - low) > MAX_LENGTH_INSERT_SORT) 





while (low < high) 
{ 


/ ne OWN iG Kiley =, 

/* 算出 枢 轴 值 pivot */ 

pivot = Partitioni(L, low, high); 
/* 对 低 子 表 递 归 排 序 */ 

QSorti(L, low, pivot - 1); 

if 9 








EE ai VE 
low = pivot + 1; 








fi 
} 


else 
InsertSort(L); 


当 我 们 将 if 改 成 while 后 〈 见 加 粗 代 码 部 分 ) ， 因 为 第 一 次 递归 以 后 ， 变 

量 low 就 没有 用 处 了 ， 上 所 以 可 以 将 pivot+1 赋 值 给 low， 再 循环 后 ， 来 一 次 

Partition(L,low,high)， 其 效果 等 同 于 “QSort(L,pivot+1,high);”。 结 果 相 

i RC 从 而 提高 了 整 
性 能 。 





在 现实 的 应 用 中 ， 比 如 C++、java、PHP、C#、VB、JavaScript 等 都 有 对 


快速 排序 算法 的 实现 ， 实 现 方式 上 略 有 不 同 ， 但 基本 上 都 是 在 我 们 讲解 
的 快速 排序 法 基础 上 的 精神 体现 。 


5. 了 不 起 的 排序 算法 





我 们 现在 学 过 的 排序 算法 ， 有 按照 实现 方法 分 类 命名 的 ， 如 简单 选择 排 
序 、 直 接 插入 排序 、 归 并 排序 ， 有 按照 其 排序 的 方式 类 比 现 实 世 界 命名 
的 ， 比 如 冒 泡 排序 、 挫 排序 ， 还 有 用 人 名 命名 的 ， 比 如 硕 尔 排序 。 但 是 
刚才 我 们 讲 的 排序 ， 却 用 “快速 ”来 命名 ， 这 也 就 意味 着 只 要 再 有 人 找到 
更 好 的 排序 法 ， 此 “快速 ”就 会 名 不 符 实 ， 不 过 ， 至 少 今 天 ，TonyHoare 
发 明 的 快速 排序 法 经 过 多 次 的 优化 后 ， 在 整体 性 能 上 ， 依 然 是 排序 算法 
王者 ， 我 们 应 该 要 好 好 研究 并 掌握 它 。 











9.10 总结 回顾 





本 章 内 容 只 是 在 讲 排序 ， 我 们 需要 对 已 经 提 到 的 各 个 排序 算法 进行 对 比 
来 总 结 回顾 。 





首先 我 们 讲 了 排序 的 定义 ， 并 提 到 了 排序 的 稳定 性 ， 排 序 稳定 对 于 某 些 
on 
稳定 H 可 。 





我 们 根据 将 排序 记录 是 否 全 部 被 放置 在 内 存 中 ， 将 排序 分 为 内 排序 与 外 
排序 两 种 ， 外 排序 需要 在 内 外 存 之 间 多 次 交换 数据 才能 进行 。 我 们 本 章 
主要 讲 的 是 内 排序 的 算法 。 








根据 排序 过 程 中 借助 的 主要 操作 ， 我 们 将 内 排序 分 为 : 插入 排序 、 交 换 
排序 、 选 择 排序 和 归并 排序 四 类 。 之 后 介绍 的 7 种 排序 法 ， 就 分 别 是 各 
种 分 类 的 代表 算法 。 


tt 
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图 9-10-1 





事实 上 ， 目 前 还 没有 十 全 十 美的 排序 算法 ， 有 优点 就 会 有 人 缺点， 即使 是 
快速 排序 法 ， 也 只 是 在 整体 性 能 上 优越 ， 它 也 存在 排序 不 稳定 、 需 要 大 














量 辅助 空间 、 对 少量 数据 排序 无 优势 等 不 足 。 因 此 我 们 束 来 从 多 个 角度 


来 剖析 一 下 提 到 的 各 种 排序 的 长 与 短 。 


我 们 将 7 种 算法 的 各 种 指标 进行 对 比 ， 如 表 9-10-1 所 示 。 


最 好 情况 ”最 坏 情况 。 。 畏 助 空间 | 稳定 性 


排序 方法 
人 所 


BERRAR 
ER th 


# Ri 
EH 

有 并 排序 
快速 排序 


表 9-10-1 
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从 算法 的 简单 性 来 看 ， 我 们 将 7 种 算法 分 为 两 类 : 


ae 








。 简单 算法 : 冒 泡 、 简 单 选择 、 直 接 插 入 。 
。 改进 算法 : 希 尔 、 堆 、 归 并 、 人 快速 。 








从 平均 情况 来 看 ， 显 然 最 后 3 种 改进 算法 要 胜 过 希 尔 排序 ， 并 远 远 胜 过 
前 3 种 简单 算法 。 





从 最 好 情况 看 ， 反 而 冒 泡 和 直接 插入 排序 要 更 胜 一 筹 ， 也 就 是 说 ， 如 宁 
你 的 待 排序 序列 总 是 基本 有 序 ， 反 而 不 应 该 考虑 4 种 复杂 的 改进 算法 。 














从 最 坏 情况 看 ， 堆 排序 与 归并 排序 又 强 过 快速 排序 以 及 其 他 简单 排序 。 


从 这 三 组 时 间 复 杂 度 的 数据 对 比 中 ， 我 们 可 以 得 出 这 样 一 个 认识 。 堆 排 
序 和 归并 排序 就 像 两 个 参加 奥数 考试 的 优等 生 ， 心 理 素 质 强 ， 发 挥 稳 
定 。 而 快速 排序 像 是 很 情绪 化 的 天 才 ， 心 情 好 时 表现 极 佳 ， 碰 到 较 糟 糕 
环境 会 变 得 差强人意 。 但 是 他 们 如 果 都 来 比赛 计算 个 位 数 的 加 减法 ， 它 
们 反而 算 不 过 成 绩 极 普通 的 冒 泡 和 直接 插入 。 





从 空间 复杂 度 来 说 ， 归 并 排序 强调 要 马 跑 得 快 ， 就 得 给 马 吃 个 饱 。 快 速 
排序 也 有 相应 的 空间 要 求 ， 反 而 扒 排 序 等 却 都 是 少量 索取 ， 大 量 付出 ， 
对 空间 要 求 是 O(1)。 如 果 执 行 算法 的 软件 所 处 的 环境 非常 在 乎 内 存 使 用 
量 的 多 少时 ， 选 择 归并 排序 和 快速 排序 束 不 是 一 个 较 好 的 决 集 了 。 

















从 稳定 性 来 看 ， 归 并 排 夺 独 占 獒 涉 ， 我 们 前 面 也 说 过 ， 对 于 非 第 在 乎 排 
序 稳定 性 的 应 用 中 ， 归 并 排序 古 个 好 算法 。 


从 等 排序 记录 的 个 数 上 来 说 ， 待 排序 的 个 数 n 越 小 ， 采 用 简单 排序 方法 
越 合 适 。 反 之 ，n 越 大 ， 有 条 用 改进 排序 方法 越 合 适 。 这 也 惑 是 我 们 为 什 
T 
J 原因 。 





从 表 9-10-1 的 数据 中 ， 似 乎 简单 选择 排序 在 3 种 简单 排序 中 性 能 最 差 ， 
实 也 不 完全 是 ， 比 如 ， 如 果 记 录 的 关键 字 本 身 信 息 量 比较 大 《例如 ， 
键 字 都 是 数 十 位 的 数字 ) ， 此 时 表明 其 占用 存储 空间 很 大 ， 这 样 移动 记 
录 所 花费 的 时 间 也 就 越 多 ， 我 们 给 出 3 种 简单 排序 算法 的 移动 次 数 比 
较 ， 如 表 9-10-2 所 示 。 




















排序 万 法 “平均 情况 “最 好 情况 
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表 9-10-2 





休会 友 現 , HCY Th) ae PRR ARS a AA, 原因 也 就 在 干 , Ee 
通过 交 量 比较 后 选择 明确 记录 进行 移动 ， 有 的 放 矢 。 因 此 对 于 数据 量 不 
征 很 大 而 记录 的 关键 字 信息 量 较 大 的 排序 要 求 ， 简 单 排序 算法 是 占 优 

的 。 力 外 ， 记 录 的 关键 字 信息 量 大 小 对 那 四 个 改进 算法 影响 不 大 。 














总 之 ， 从 综合 各 项 指标 来 说 ， 经 过 优化 的 快速 排序 是 性 能 最 好 的 排序 算 
法 ， 但 是 不 同 的 场合 我 们 也 应 该 考虑 使 用 不 同 的 算法 来 应 对 它 。 





9.11 结尾 语 


完 排 序 ， wie 够 感受 到 ， 我 们 的 算法 研究 者 们 都 是 在 “似乎 不 可 能 ”的 
情况 下 步 提高 排序 算法 的 性 能 的 。 在 剩 下 的 几 分 钟 时 间 里 ， 我 们 再 
来 做 一 Me 感受 一 下 把 不 可 能 变 为 可 能 。 





请 问 如 何 把 图 9-11-1 中 用 四 段 直线 一 笔 将 这 九 个 点 连 起 来 ? 


图 9-11-1 


大 家 举 手 很 快 ， 因 为 绝 大 多 数 同学 应 该 都 看 过 这 道 题 目 。 没 有 做 过 题目 
的 同学 通 利 十 有 八 九 会 落 入 一 个 小 小 的 陷阱 ， 在 九 个 点 围 成 的 框 中 打转 
转 ， 然 后 发 现 至 少 要 五 段 以 上 的 直线 才能 连 成 。 结 果 是 ， 要 找到 答案 ， 
必须 在 思维 上 突破 这 九 个 点 所 围 成 的 框框 的 限制 ， 如 图 9-11-2 所 示 。 





图 9-11-2 





如 打 智 力 题 这 惑 结束 了 ， 那 就 不 考 大 家 了。 现在 我 的 问题 是 如 何 做 到 三 
段 直线 一 笔 将 这 九 个 点 连 起 来 ? 





此 时 ， 大 家 都 在 区 头 接 耳 ， 心 里 一 定 想 着 , “这 怎么 可 能 ? ”我 来 公布 答 
和 案 ， 那 就 是 用 一 条 “Z? 字 线 即 可 一 笔 连 成 。 也 许 ， 最 快 找 出 这 个 答案 的 
征 那 些 没 有 学 过 数学 的 孩子 。 作 为 成 人 ， 我 们 已 被 吃 一 些 “ 框 框 ?所 框 住 
大 脑 。 那 就 是 数学 上 有 一 条 基本 公理 : 两 条 平行 线 永 不 相交 。 另 外 数学 
上 有 男 一 个 基本 假设 点 没有 大 小 。 可 在 现实 中 任何 一 点 都 会 有 大 小 。 
突破 这 一 限制 ， 只 要 无 限 延长 <Z” 字 三 段 线 ， 九 点 必 可 一 笔 连 。 来 看 图 
9-11-3。 








图 9-11-3 


有 同学 说 ， 我 图 中 的 点 比 刚 才 的 要 大 ， 这 不 符 已 。” 





本 章 的 结束 ， 其 实 也 就 是 数据 结构 这 门 课 的 结束 了 。 数 据 结构 和 算法 ， 
还 有 很 多 内 容 我 们 并 没有 涉及 。 要 想 真 正 掌握 数据 结构 ， 并 把 它 应 用 到 
工作 中 ， 你 们 的 路 还 很 长 。 














我 们 生命 中 ， 矛 盾 和 困惑 往往 一 直 伴 随 。 很 多 同学 来 学 习 数 据 结 构 ， 其 
实 并 不 是 真 的 明白 它 的 重要 性 ， 通 常 只 是 因为 学 校 开 了 这 门 识 ， 而 不 得 
不 来 这 里 弄 个 PASS， 过 后 ， 真 到 需要 用 时 ， 却 友 现 力不从心 而 退 悔 英 














及 。 比 如 图 9-11-4 所 示 ， 塌 剧 通 常 束 是 这 样 产 生 的 。 因 此 上 尽 定 现在 是 访 
程 的 最 后 ， 对 于 个 别 没有 重视 这 门 读 的 同学 来 说 有 些 晚 了 了， 我 还 是 想 再 
EFIE: 数据 结构 和 算法 对 于 程序 员 的 职业 人 生来 说 ， 那 就 是 两 个 圆 
圈 的 交集 部 分 ， 用 心 去 掌握 它 ， 你 的 编程 之 路 将 会 是 坦途 。 








我 觉得 应 该 学 习 的 知识 


能 够 赚钱 的 知识 





图 9-11-4 
最 后 送 大 家 电影 《 当 钼 福来 融 门 》 中 的 一 句 话 : 


You got a dream, you gotta protect it.People can't do something themselves, 


theywanna tell you you can't do it. If you wantsomething, go get it. Period. 
CHAR AE, MERELE. AIAKAS, MAIA 
要 告诉 你 ， 你 也 不 能 。 如 果 你 想 要 些 什 么 ， 就 得 去 努力 争取 。 融 这 
样 ! ) 


同学 休 , 再見 ! 
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